gzipattua sisältöä puntariketjussa?

Ik heb zorgen - palautteet ja tiedotteet. Voit kirjoittaa tänne ilman rekisteröitymistä.
Avatar
Rousku
Kanta-asiakas
Kanta-asiakas
Viestit: 41806
Liittynyt: 17 Helmi 2007, 22:57

gzipattua sisältöä puntariketjussa?

Viesti Kirjoittaja Rousku »

Erittäin tekninen kysymys nyt:

Tutkin kuppilan tämän vuoden viisupuntarin sivujen otsikkotietoja. Minkä takia kolmannen sivun otsikoista löytyy ('Content-Encoding', 'gzip'), vaikka sitä kahden muun sivun otsikoissa ei ole? (Eli tuo löytyy Pythonilla näin: print(urllib.request.urlopen(url).getheaders()), ja sen tuloksia eri urleilla tarkastelemalla.)

Tuo lienee ilmaantunut joskus viimeisen vuorokauden aikana sinne.

Ei siinä muuta, mutta kun hieno puoliautomaattinen puntaridatan nouto- ja analyysityökaluni kaatuu tuohon zippaukseen... ts. en saa sitä kolmannen sivun dataa ainakaan ihan sillä tavoin helposti käyttöön kuin ennen. Ehkä löydän jonkin kätevän kiertotien. Mutta olisihan tuolle kiva jokin selityskin löytää.

Edit: taitaa vähitellen selvitä. Tuli vain vähän yllärinä.
Rise, angel, shine, love!

Vastaa Viestiin