Sivu 1/1

gzipattua sisältöä puntariketjussa?

Lähetetty: 04 Maalis 2020, 21:30
Kirjoittaja Rousku
Erittäin tekninen kysymys nyt:

Tutkin kuppilan tämän vuoden viisupuntarin sivujen otsikkotietoja. Minkä takia kolmannen sivun otsikoista löytyy ('Content-Encoding', 'gzip'), vaikka sitä kahden muun sivun otsikoissa ei ole? (Eli tuo löytyy Pythonilla näin: print(urllib.request.urlopen(url).getheaders()), ja sen tuloksia eri urleilla tarkastelemalla.)

Tuo lienee ilmaantunut joskus viimeisen vuorokauden aikana sinne.

Ei siinä muuta, mutta kun hieno puoliautomaattinen puntaridatan nouto- ja analyysityökaluni kaatuu tuohon zippaukseen... ts. en saa sitä kolmannen sivun dataa ainakaan ihan sillä tavoin helposti käyttöön kuin ennen. Ehkä löydän jonkin kätevän kiertotien. Mutta olisihan tuolle kiva jokin selityskin löytää.

Edit: taitaa vähitellen selvitä. Tuli vain vähän yllärinä.