Subscribe: Comments on: Seznam.cz a RSS - jak to zpracovat?
http://www.marigold.cz/item/seznamcz-a-rss-jak-to-zpracovat/feed/
Added By: Feedage Forager Feedage Grade A rated
Language: Czech
Tags:
aby  bych  chunked  content length  content  dusek texy  dusek  jakub dusek  jakub  length  marigold  seznam  texy    zkusil bych  že 
Rate this Feed
Rate this feedRate this feedRate this feedRate this feedRate this feed
Rate this feed 1 starRate this feed 2 starRate this feed 3 starRate this feed 4 starRate this feed 5 star

Comments (0)

Feed Details and Statistics Feed Statistics
Preview: Comments on: Seznam.cz a RSS - jak to zpracovat?

Komentáře: Seznam.cz a RSS – jak to zpracovat?



Bezdrátové a mobilní sítě, nová média, digitální knihy a jiná hudba budoucnosti



Last Build Date: Mon, 20 Nov 2017 14:15:37 +0000

 



Od: Martin

Sat, 11 Nov 2006 07:26:40 +0000

Sice byl problém už vyřešen, ale ještě doplním - pokud je transfer-encoding chunked, pak je nesmysl posílat i content-length! Plyne to už z principu - chunked je určen pro případy, kdy nevíme celkovou délku a posíláme odpověď po kouscích (u kterých délku známe). Každý kdo se montuje do web aplikací by měl mít protokol http nastudovaný!



Od: Noname

Fri, 10 Nov 2006 11:41:30 +0000

re Jan - děkuji, to je zajímavá informace že Seznam používá tenhle způsob určený pro anonymní proxy. To bude zřejmě ta chyba, předpokládám, že to je o nějakém nastavení u poskytovatele, dnes v 18:00 se bude konečně přecházet na ten nethost, tak se mi na to pak kouknou



Od: Jan Angelovič

Fri, 10 Nov 2006 04:14:09 +0000

Robot, který stahuje stránku při prvním kontaktu, používá "GET **http://www.marigold.cz**/wp-rss2.php HTTP/1.1". Marigold na to vrátí *404* a pak soubor vypíše (?). Pokud se volá jen "GET /wp-rss2.php HTTP/1.X", vyhodí server klasicky *200*. No a Seznam vcelku pochopitelně kontroluje nejdřív hlavičky a na těch se zarazí.



Od: Wu

Thu, 09 Nov 2006 23:37:11 +0000

Koukám že jsme se trochu posunuli. Zkusil bych přidat content-length, vypnout chunked (Martin by mohl mít pravdu) a ten zip, no já nevím, možná taky. Aby to bylo co nejpodobnější statickému xml.



Od: Jakub Dusek

Thu, 09 Nov 2006 20:57:05 +0000

Ja vedel ze jsem to s Content-Length kdysi davno delal nejak i v PHP :) http://www.edginet.org/techie/website/http.html Kapitola Content-Length header Staci dat na zacatek generovani XML ob_start(), na konec ob_end_flush() a pred to pridani HTTP hlavicky: header('Content-Length: ' . ob_get_length()); Vyreseni problemu bych si od toho nesliboval, ale Content-Length to prida.



Od: Jakub Dusek

Thu, 09 Nov 2006 20:36:02 +0000

... a jeste jeden napad: zkusil bych se zamerit na to jaka prijde hlavicka requestu ze Seznamu (odchytit ji v logu) a jaky skutecne response se vrati po tomhle requestu (na to se da vyuzit treba ta hlavicka a poslat znovu). Napriklad by podle me mohlo byt v hlavicce requestu zajimave Accept-Charset nebo Accept-Encoding. No, jen napady :)



Od: Jakub Dusek

Thu, 09 Nov 2006 20:28:47 +0000

Pro doplneni odkaz na to jak se to nastavuje a jak to funguje v IIS (i kdyz tusim ze to asi nepomuze :)): http://www.microsoft.com/technet/prodtechnol/WindowsServer2003/Library/IIS/0b8f96a0-53ab-4ef4-ab2e-7bfc5b6f426d.mspx?mfr=true



Od: Jakub Dusek

Thu, 09 Nov 2006 20:25:26 +0000

Aby byl v response Content-Length se da vetsinou nastavit i na urovni HTTP serveru. Problem je v tom ze u skriptovanych veci se na zacatku nevi kolik dat se bude posilat, proto je to nevyplnene. Ale da se nastavit, aby se skriptovane veci nejdriv poskladaly na serveru, ohlavickovaly skutecnou velikosti a potom se teprve odesilaly na klienta. Mozna bych si vzpomnel kde je to u IIS, jednou jsem to tam nastavoval jako rychly workaround chyby moji aplikace :) Nicmene jako dlouhodobe reseni bych to nedoporucoval, navic bych to jako pricinu skoro vyloucil. Na Content-Length se neda spolehat nikdy a Seznam by mel mnohem vetsi problemy kdyby bez nej neumel pracovat.



Od: Martiner

Thu, 09 Nov 2006 18:19:56 +0000

Tak třeba já jsem měl doteď ve čtečce tohle URL http://www.marigold.cz/feed/rss2.xml , které už není ani feed ani rss...



Od: Martin

Thu, 09 Nov 2006 18:13:39 +0000

ad Pachollini: Poprvé vidíš chunked (nakouskovaný) přenos? Ten začátek není příznak utf-8, to je délka příslušného kousku (chunk). Aby se nakonec neukázalo, že géniové v Seznamu neumí http/1.1 (umět chunked je povinné :)