Hledat
Přihlásit se
  • Věda a technika
  • Herní doupě
  • Tipy pro PC
  • IT Byznys
  • Mobily
  • Počítače
  • Počítače
  • Témata
  • Poradna
  • Diskuzní fórum
  • Video
  • Bazar
  • Blogy
  • MĚŘENÍ RYCHLOSTI
  • RSS
  • Facebook Twitter Google+ YouTube
  • Hardware
  • Software
  • Počítače
  • Notebooky
  • Služby na webu
  • Apple
  • Google
  • Microsoft
  • Seznam
  • Tiskové zprávy
Další témata
  • Týden Živě
  • Zprávy Živě
  • Testy
  • Pitvy
Všechna videa
X

Doporučit článek

Vaše jméno:

Váš e-mail:

E-mail adresáta:

Komentář:

kontrolní kód

Odeslat

Blogy Živě » Dejvidův blog

Dejvidův blog

o webu (2.0) a tak různě…
 

Přednáška od Seznamu - Email.cz

30. 9. 2009, DejvidCh

VŠE (resp. Katedra informačního a znalostního inženýrství z Fakulty informatiky a statistiky) již několikátý semestr pořádá sérii přednášek ve spolupráci s firmou Seznam.cz. Jelikož mám tento semestr v termínu přednášek čas, na ty zajímavé se půjdu podívat a přednášku shrnu článkem zde na blogu.

První přednáška se týkala freemailu společnosti Seznam. Přednášet přišel programátor pan Michal Bukovský. Budu se držet jeho jeho prezentace a začnu několika zajímavými čísly.

  • Pouze 10 lidí se ve firmě věnuje e-mailu na fulltime (programátoři, administrátoři a produktový manager).
  • Chod e-mailu zabezpečuje přes 500 serverů.
  • 2/3 z ukládaných zpráv je spam.
  • Seznam má 6 milionů aktivních uživatelů e-mailových schránek.
  • V průměru přichází 80000 požadavků/minutu, přijímá se 15000 zpráv/minutu, ukládá se 2000 zpráv/minutu a odesílá 2500 zpráv/minutu.
  • Celková velikost uložených zpráv všech uživatelů v současné době dosahuje 2,4PB dat (přes 70% jsou duplicitní data).
  • Průměrná velikost zprávy je přes 400kB, přičemž ještě před 2 lety to bylo 40kB.
  • Přes 90% komunikace je v rámci České Republiky.
  • Naprostá většina uživatelů zdaleka nevyužije kapacitu 2GB, nicméně je několik jednotlivců, kteří mají ve své schránce více než 200GB dat.
  • Přibližně 80% uživatelů přistupuje k emailu prostřednictím webového rozhraní.

Další část přednášky byla věnována architektuře seznamáckého mailu. Tuto část vynechám, protože nemám povolení k distribuci slajdů, bez kterých by text ztrácel na své přehlednosti a srozumitelnosti.

Dále byla věnována pozornost uchovávání (storage) dat. Pan Bukovský v této části zmiňoval, že není problém velikost dat jako taková, ale extrémní požadavky na rychlost a četnost I/O operací, které jsou v prostředí českého internetu nevídané a tímpádem neustále bojují s limitující rychlostí pevných disků. Jinak file servery jsou používány dva, v případě výpadku je druhý FS schopen chybějící zastoupit (v případě špičky ovšem velmi reálně hrozí spadnutí).

Další, v podstatě poslední a velmi obsáhlá část přednášky byla věnována spamu.

Zde pan Bukovský hned na úvod zmínil, že velký traffic nutně neznamená nevýhodu. Pokud například dojde k aktivaci nějakého viru či hromadného odesílání spamu z konkrétní oblasti, vzhledem k počtu schránek se to Seznam dozví v českém prostředí pravděpodobně jako první a může tak odekvátně zareagovat (například zablokovat konkrétní IP adresy). Co se týká největších spamerů z hlediska států, tak to (možná pro někoho překvapivě) není Rusko, jihovýchodní Asie, ale Spojené Státy.

V boji proti spamu Seznam postupuje dvojím způsobem. K prvnímu filtrování spamu dochází již na SMTP serveru, e-maily, které projdou tímto filtrem jsou dále prověřovány spamovým scannerem.

Na SMTP serveru se používá:

  • GeoIP - “IP rasismus”, blokace IP adres z konkrétních oblastí, zemí
  • Autoblocker - automatický IP / User blacklist
  • SPF - vlastník domény určuje, z kterých IP adres mohou chodit maily
  • GrayList - mail transfer agent dočasně odmítá maily od nerozpoznaného odesílatele. Pokud se za určitý časový interval požadavek zopakuje, email je přijat (v případě spammerů, kteří odesílají tisíce mailů, se tyto požadavky většinou neopakují).
  • Blacklisty a Whitelisty
  • Delivery test

Spam scanner dále používá:

  • Domain Keys - něco jako elektronický podpis emailu a některých položek v jeho hlavičce
  • SpamAssassin
  • Bayeovské filtry - statistická analýza počtu konkrétních slov, odkazů a dalších součástí, které spam často obsahuje.
  • IP/URL DNS blacklisty
  • DCC blacklisy
  • Sbírání URL

Vzhledem k velikosti Seznamu je zřejmé, že i on se dopouští rozesílání spamu. Proti tomu tým okolo e-mailu bojují především pomocí CAPTCHA, která je přítomna v případě používání e-mailu v zahraničí. Zde Bukovský zmiňoval zajímavou věc - když CAPTCHA zavedli, trvalo přibližně pouze čtvrt hodiny, na kterou spamy utichly. V důsledku toho dospěli k závěru, že nebojují s nějakými automatickými nástroji (za tak krátkou dobu by někdo těžko předělal skripty, aby dokázali obejít tuto techniku), ale s lidmi někde v zemích třetího světa. Nakonec tento problém vyřešili poměrně razantně, do CAPTCHA zavedli naší diakritiku, čímž ovšem spolu se spammery odřízli také české uživatele, kteří chtějí používat webmail ze zahraničí.

Co se virové problematiky týče, tak se používá NOD32 scanner. Viry jsou však v dnešní době poměrně malý problém, oproti spamu zcela marginální.

Po přednášce bylo množství dotazů, zmíním jediný a to proč Seznam velmi dlouhou dobu odmítal zprovoznit IMAP. Podle přednášejícího to bylo především z důvodu náročnosti tohoto protokolu, některým technickým problémům (protokol IMAP vyžaduje nepřetržité spojení) a také přesvědčením, že to bude používat pouze minimum lidí.

Příště, pokud mi do toho něco nevlezle a najdu v komentářích nějaké pozitivní ohlasy ( :-) ) se můžete těšit na téma Přístupnost v praxi.

Štítky: e-mail, Seznam, spam


Publikováno v rubrice články. Reakce v diskuzi lze sledovat prostřednictvím RSS 2.0. Můžete přidat komentář, nebo se na článek odkázat ze svého webu.

« Přednáška od Seznamu - fulltext (1)
Proč tolik averze vůči Facebooku? »
 

Komentáře v diskuzi

1.  Linda(86.49.40.xxx)   1. 10. 2009, 04:59

Prednaska byla super, ale prekvapilo me, jak malo lidi tam bylo :-(

2.  DejvidCh(ověřeno)   1. 10. 2009, 07:34

Nj, tento rok poněkud nevýrazná propagace celé akce…

3.  MArtin(89.176.101.xxx)   1. 10. 2009, 09:39

Kdo by chodil na přednášku o Seznam emailu, když je zastaralý a nevyvíjený. Navíc jde proti uživateli: captcha v zahraničí, s diakritikou? To pánové snad upadli, ne? Stejně tak IMAP: proč se snažit poučit uživatele, že IMAP je mnohem lepší než POP3? Raději to vůbec nezavedeme…

4.  aldik7(89.103.190.xxx)   1. 10. 2009, 09:57

martin: nj dalo se čekat že se tady objeví zas nějaký blbec co bude akorát kritizovat něco úspěšného :/

5.  DejvidCh(ověřeno)   1. 10. 2009, 10:47

MArtin: Jo, zastaralý a nevyvíjený.. On je trochu problém v tom, že většina uživatelů je poměrně konzervativních a jakékoliv změny přijímají se značnou nelibostí.. Holt email od Seznamu je pro “běžné” uživatele, gmail je tak trochu víc pro “geeky”.

6.  czexit(195.113.184.xxx)   1. 10. 2009, 12:21

s tou captchou a diakritikou je to z meho pohledu zajimavy napad (ano odhlizim, od problemu pouzitelnosti na jine klavesnici nez ceske…)
Rozhodne ho na nekterem webu vyzkousim, jaka bude uspesnost :)

7.  anakinb(80.83.67.xxx)   2. 10. 2009, 12:09

Kdy ta přednáška byla? Nechápu proč to nepropagovali.

8.  DaemonCZ(217.195.166.xxx)   3. 10. 2009, 00:44

Ač jsem stihl necelou půlku přednášky, myslím si, že obsahově byla k věci a i styl, kterým byly informace podány, byl více než dobrý. Jsem rád, že mi byl zodpovězen dotaz na IMAPm jelikož to je první věc, která se mi vybaví při slovním spojení Seznam a email:-)
Každopádně chválím za příspěvek na blogu…

9.  spora(90.178.150.xxx)   5. 10. 2009, 17:06

Když je přes 70 % dat duplicitních, mohli by použitím deduplikace dooooost ušetřit :) Tedy pokud už to nedělají…

10.  meero(85.207.123.xxx)   7. 10. 2009, 19:34

Jak je to s tim IMAPem, bude, nebude, pripravuje se?

11.  DejvidCh(ověřeno)   7. 10. 2009, 22:26

Připravuje se…

Přidat komentář

*
Opište prosím text z obrázku.
Anti-Spam Image


Aktuální články a bleskovky

Zprávy Živě: Apple opět lámal rekordy
Zprávy Živě: Apple opět lámal rekordy
Nechte si vytvořit vizitky z Facebooku skoro zdarma
Nechte si vytvořit vizitky z Facebooku skoro zdarma
Černobíle: Více oken na ploše, nebo jedno Metro?
Černobíle: Více oken na ploše, nebo jedno Metro?
ČR a další země EU podepsaly protipirátskou dohodu ACTA
ČR a další země EU podepsaly protipirátskou dohodu ACTA



Dejvidův blog využívá WordPress MU a běží na Blog.zive.cz. Vytvořte si svůj vlastní blog
Sledování přes RSS: články a komentáře


  • Štítky

    akinator anotace Bing Digifórum diplomová práce e-mail e-shopy elektronika Facebook fotky foto fulltext Google Google Image Labeler Google maps hardware historie informatika internetová reklama mapy mashup metadata mobily motivace multimedia nakupování Office Ondřej Neff osobní produkt Seznam spam street view tag cloud výuka video videoagregátor videoservery vyhledávače web 2.0 web design WolframAlpha zábava
  • Poslední příspěvky

    • Google Image Labeler
    • Přednáška od Seznamu - Produkt a jeho reálný přínos
    • Přednáška od Seznamu - fulltext (1)
    • Přednáška od Seznamu - Email.cz
    • Proč tolik averze vůči Facebooku?
  • Administrace

    • Přihlásit se

1202_infobox.png

Časopis Computer

  • Zrychlete Windows
  • Test 25 notebookových brašen
  • Ultrabook Toshiba Portégé 
  • Pitva Blu-ray mechaniky
  • Radíme s koupí Wi-Fi routeru

Partnerská sekce pro IT profesionály:
Microsoft TechNet/MSDN


Video Živě

Zprávy Živě - 28. ledna 2012
Sniffer pro Android
Týden Živě 160. - 22. ledna 2012
Zprávy Živě - 21. ledna 2012

další videa »






Mladá Fronta a.s. Mladá Fronta a.s.
Tiráž | Autoři | Připomínky | Odběr novinek | RSS | Textová verze
Copyright 2000–2012 Mladá fronta a.s. | Inzerce: onlinesales@mf.cz | Kontakt na redakci | Návštěvnost měří NetMonitor