E-mailovou složku se spamem a viry mažu až po delší době. Abych náhodou nenávratně neodstranil něco důležitého. Spamový filtr SpamBayes sice funguje spolehlivě, ale je to také díky tomu, že většina „dobré“ pošty mi chodí v češtině, zatímco nabídky na delší sex se zvětšeným údem za poslechu tikotu hodinek Rolex bývají v jazyce anglickém. Takže filtr se někdy chybně snaží uchránit před mým zrakem i e-maily od Google či amerického kamaráda.
Antispamový vs. spamový filtr
Trošku odbočím, ale právě mě trklo, jak spousta lidí používá termín Antispamový filtr. Vlastně většina (1270 : 1199)! Nejsem sice študovanej, ale selský rozum mi říká, že antispamový filtr je zařízení, které odfiltruje opak spamu a samotný spam propustí. K čemu je to dobré, vskutku nevím, ale rozhodně spíš doporučuji používat „spamové filtry“ 🙂
Statistika nuda je
Statistika nuda je, má však cenné údaje. Než jsem smazal měsíc starou složku se spamy a viry (nepoužívám e-mailový antivir, spolehlivě jej nahradí spamfiltr), změřil jsem pár hodnot:
Spamů a virů za měsíc listopad | 1135ks (32ks / den) |
Objem | 47MB (1,6MB / den) |
Průměrná velikost 1 spamu | 41kB |
Podívejme se ještě na statistiky, které prezentuje filtr SpamBayes. Údaje jsou za 7 měsíců provozu, nicméně o prázdninách je e-mailů vždy méně, tedy můžeme je považovat za půlroční.
Přijato | 11559 e-mailů |
Označeno jako spam | 66% |
Označeno jako dobré | 31% |
Nebyl si jist | 3% |
Chybně považováno za spam | 0,2% |
Chybně označeno jako dobré | 0,5% (odhadem) |
Poměr spam:dobré | 2:1 |
Nemít občasnou anglickou konverzaci, těch omylů by bylo mnohem méně. Na druhou stranu, zajímala by mě účinnost filtrů u Angličanů a Američanů.
Závěry
A v záveru našej relácie si urobíme volaké závery, hej?
- Bayesovský filtr je v českém prostředí vynikající
- Spam tvoří zanedbatelný objem přenesených dat (u mě cca 5%)
- Poměr spam/antispam není zas tak drtivý, jak jsem se domníval
- SMS notifikace provedená před filtrováním je dobrá jen pro masochisty
Ale jde o výzkum provedený na jednom jediném vzorku, závěry jsou tedy neobjektivní. Proto bych vyzval čtenáře, zda by se mohli o podělit o své zkušenosti!
Komentáře
kakoo #1
sms notifikaci mám před spam filtrem – ovšem jen maily, který jsou z .cz … málokdy přijde zahraniční spam s podvrhnutou adresou z .cz… a pokud si budu psát s někým z jiné domény, notifikaci oželím nebo udělám samotný filtr pro něj – mluvím ovšem o t-zones, nevím, jak moc jde nastavovat u ost. operátorů
Jiří Bureš #2
Tak to se máš dobře. Já mám „užitečné“ pošty tak kolem 5 % – viz https://blog.converter.cz/…
Hollyfood #3
Dejve, docela bych s tebou polemizoval, páč podle tvé definice by antivirové programy propouštěly viry a nezávadné zprávy naopak potíraly. Takže buď je tvá teorie mylná nebo jsou v omyl antivirové firmy (AVG jako takové je omyl v obou případech).
David Grudl #4
#3 Hollyfoode, jde o kombinaci předpony anti- a slova filtr. Prostě kávový filtr v překapávači zachytává kávu, prachový filtr zachytává prach, spamový filtr zachytává spam a co dělá antispamový filtr? Zachytává anti-spam. A spam propouští dál 😉
MaD #5
Čistě anglická pošta by měla být ve skutečnosti pro Bayesovské filtry stravitelnější, než takovýto mix, protože ho nebudou mást běžná anglická slova, která ve vaší poště znamenají vysokou pravděpodobnost spamu, zatímco u anglického uživatele budou nezajímavá.
Jan Vaněk jr. #6
Sice taky nejsem studovaný, ale produktivní přípona -ový má rozhodně víc významů než „na X“. Rozhodně dám přednost protitetanové injekci před tetanovou.
David Grudl #7
#6 Jane Vaňku jr., jsem si to ale zavařil, ač byla poznámka o antiXXX filtru myšlena jako vtípek, teď abych ji obhajoval v každém druhém komentáři 😉
Jakub #8
Dobrý den.
Nejsem žádný IT profesionál.
Mám jen jednoduchou otázku:
mb znamená megabit, megabyte nebo MalýBordel?
Ve školce nám vychovatelky říkaly, že:
MB je megabajt
Mb je megabit
ale s mb je pro mne absolutní novinka.
Předem děkuji za odtajnění záhadné zkratky
David Grudl #9
#8 Jakube, mb? to bude nejspíš Mladá Boleslav, ale ještě to ověřím 🙂
Jakub #10
#9 Davide Grudle, už vím !!
mb=malý bobeš 🙂
nebo něco více počítačového?
frantisek #11
chodi mi 18 spamu denne (prumer), nejvice 30.11. (34ks)
i u me jde o zanedbatelne procento prenesenych dat, hlavni cast objemu tvori 🙂 pps a ppt
antispamovy filtr jsem pochopil – chyta nespamy, pousti spamy. je to tak?
a jako pocitacovy neodbornik chapu, ze mluvi li nekdo o objemu prenesenych dat, je velmi nepravdepodobne, ze by ho uvadel v megabitech , ze
David Grudl #12
#11 frantisku, Jakub má pravdu v tom, že jsem použil špatnou jednotku. A donutil mě tím si konečně zjistit, jak se to správně píše. Teď už jsou jednotky ve článku a nadpisu opravené.
Jinak zjišťuji, že dlouhodobé statistiky SpamBayes jsou mnohem pozitivnější, než co ukazuje denní praxe. Toho spamu je mnohem větší procento…
Mark #13
Myslim ze zrovna na TE strance to maji popsane docela blbe. … mrkni radsi na wikipedii 🙂 … spravne bys mel mit v clanku jednodku MiB (megabinarybyte – zkracene mebibyte) 🙂
Tento článek byl uzavřen. Už není možné k němu přidávat komentáře.