|
|
VŠE (resp. Katedra informačního a znalostního inženýrství z Fakulty informatiky a statistiky) již několikátý semestr pořádá sérii přednášek ve spolupráci s firmou Seznam.cz. Jelikož mám tento semestr v termínu přednášek čas, na ty zajímavé se půjdu podívat a přednášku shrnu článkem zde na blogu.
První přednáška se týkala freemailu společnosti Seznam. Přednášet přišel programátor pan Michal Bukovský. Budu se držet jeho jeho prezentace a začnu několika zajímavými čísly.
Další část přednášky byla věnována architektuře seznamáckého mailu. Tuto část vynechám, protože nemám povolení k distribuci slajdů, bez kterých by text ztrácel na své přehlednosti a srozumitelnosti.
Dále byla věnována pozornost uchovávání (storage) dat. Pan Bukovský v této části zmiňoval, že není problém velikost dat jako taková, ale extrémní požadavky na rychlost a četnost I/O operací, které jsou v prostředí českého internetu nevídané a tímpádem neustále bojují s limitující rychlostí pevných disků. Jinak file servery jsou používány dva, v případě výpadku je druhý FS schopen chybějící zastoupit (v případě špičky ovšem velmi reálně hrozí spadnutí).
Další, v podstatě poslední a velmi obsáhlá část přednášky byla věnována spamu.
Zde pan Bukovský hned na úvod zmínil, že velký traffic nutně neznamená nevýhodu. Pokud například dojde k aktivaci nějakého viru či hromadného odesílání spamu z konkrétní oblasti, vzhledem k počtu schránek se to Seznam dozví v českém prostředí pravděpodobně jako první a může tak odekvátně zareagovat (například zablokovat konkrétní IP adresy). Co se týká největších spamerů z hlediska států, tak to (možná pro někoho překvapivě) není Rusko, jihovýchodní Asie, ale Spojené Státy.
V boji proti spamu Seznam postupuje dvojím způsobem. K prvnímu filtrování spamu dochází již na SMTP serveru, e-maily, které projdou tímto filtrem jsou dále prověřovány spamovým scannerem.
Na SMTP serveru se používá:
Spam scanner dále používá:
Vzhledem k velikosti Seznamu je zřejmé, že i on se dopouští rozesílání spamu. Proti tomu tým okolo e-mailu bojují především pomocí CAPTCHA, která je přítomna v případě používání e-mailu v zahraničí. Zde Bukovský zmiňoval zajímavou věc - když CAPTCHA zavedli, trvalo přibližně pouze čtvrt hodiny, na kterou spamy utichly. V důsledku toho dospěli k závěru, že nebojují s nějakými automatickými nástroji (za tak krátkou dobu by někdo těžko předělal skripty, aby dokázali obejít tuto techniku), ale s lidmi někde v zemích třetího světa. Nakonec tento problém vyřešili poměrně razantně, do CAPTCHA zavedli naší diakritiku, čímž ovšem spolu se spammery odřízli také české uživatele, kteří chtějí používat webmail ze zahraničí.
Co se virové problematiky týče, tak se používá NOD32 scanner. Viry jsou však v dnešní době poměrně malý problém, oproti spamu zcela marginální.
Po přednášce bylo množství dotazů, zmíním jediný a to proč Seznam velmi dlouhou dobu odmítal zprovoznit IMAP. Podle přednášejícího to bylo především z důvodu náročnosti tohoto protokolu, některým technickým problémům (protokol IMAP vyžaduje nepřetržité spojení) a také přesvědčením, že to bude používat pouze minimum lidí.
Příště, pokud mi do toho něco nevlezle a najdu v komentářích nějaké pozitivní ohlasy (
) se můžete těšit na téma Přístupnost v praxi.
Prednaska byla super, ale prekvapilo me, jak malo lidi tam bylo ![]()
Nj, tento rok poněkud nevýrazná propagace celé akce…
Kdo by chodil na přednášku o Seznam emailu, když je zastaralý a nevyvíjený. Navíc jde proti uživateli: captcha v zahraničí, s diakritikou? To pánové snad upadli, ne? Stejně tak IMAP: proč se snažit poučit uživatele, že IMAP je mnohem lepší než POP3? Raději to vůbec nezavedeme…
martin: nj dalo se čekat že se tady objeví zas nějaký blbec co bude akorát kritizovat něco úspěšného :/
MArtin: Jo, zastaralý a nevyvíjený.. On je trochu problém v tom, že většina uživatelů je poměrně konzervativních a jakékoliv změny přijímají se značnou nelibostí.. Holt email od Seznamu je pro “běžné” uživatele, gmail je tak trochu víc pro “geeky”.
s tou captchou a diakritikou je to z meho pohledu zajimavy napad (ano odhlizim, od problemu pouzitelnosti na jine klavesnici nez ceske…)
Rozhodne ho na nekterem webu vyzkousim, jaka bude uspesnost ![]()
Ač jsem stihl necelou půlku přednášky, myslím si, že obsahově byla k věci a i styl, kterým byly informace podány, byl více než dobrý. Jsem rád, že mi byl zodpovězen dotaz na IMAPm jelikož to je první věc, která se mi vybaví při slovním spojení Seznam a email:-)
Každopádně chválím za příspěvek na blogu…
Když je přes 70 % dat duplicitních, mohli by použitím deduplikace dooooost ušetřit
Tedy pokud už to nedělají…
Jak je to s tim IMAPem, bude, nebude, pripravuje se?
Připravuje se…
Dejvidův blog využívá WordPress MU a běží na Blog.zive.cz. Vytvořte si svůj vlastní blog
Sledování přes RSS: články
a komentáře
Partnerská sekce pro IT profesionály:
Microsoft TechNet/MSDN