dijous, de juny 03, 2004
Patent de programari antispam per NAI.
L'oficina de patents nordamericana ha otorgat la patent 6.732.157 a l'empresa Network Associates Inc. Aquesta patent cobreix un sistema de programari de filtrat de correu no desitjat o spam basat en mètodes genètics (cerca de paraules clau), l'ús de funcions de hash per a les cerques de frases o paraules, i la utilització de mètodes probabilístics i en concret el teorema de Bayes per al càlcul de la probabilitat de que un missatge sigui spam. Tot l'anterior no és high tech. Fins i tot és possible que a molts els soni la fórmula de càlcul de probabilitats de Bayes, i si no només cal que repasseu els llibres de matemàtiques de 4rt d'ESO.
Per dir-ho d'una altra manera, aquesta patent de programari cobreix la inmensa totalitat dels sistemes de filtrat d'spam usats avui en dia. Però els primers estudis acadèmics sobre la classificació automàtica de documents daten de bastant més enrera, dirigits des de les branques científiques del data mining i la intel·ligència artificial.
Per exemple, un dels estudis i implementacions que feia ús del teorema de Bayes per a determinar a quin grup pertanyia un document és d'en Charles Ling, doctor per la Universitat de Pensilvània, conjuntament amb altres i al voltant de l'any 2000. Emperò degut a problemes col·laterals en la tria dels tokens sobre els quals van realitzar els càlculs, resultà ser que els antics algoritmes genètics eren més exactes que els probabilístics. L'assumpte va quedar aparcat fins al 2002, amb l'arribada creixent de l'spam amb els correus electrònics i un article d'en Paul Graham, del MIT, que ens recordà que els filtres probabilístics podrien funcionar bastant bé en aquest cas (i així ha estat, unit a un refinament de la tècnica).
Ara tot aquest coneixement està en mans d'una empresa multinacional, que dit sia, no ha estat precisament el motor de la innovació en aquest camp. S'haurà de veure de quina manera protegeixen la seva patent, si es que la poden conservar, i què passarà amb les decenes d'aplicacions que empren els mètodes anteriors. Jo per la meva banda, esper que a Europa els polítics aixequin el cap i no aprovin les patents al programari. Per a tal affer, un bon cop de mà és col·laborar amb la Foundation for a Free Information Infrastructure i per descomptat votar un partit polític que no suporti i estigui en contra de les patents de programari.
Per dir-ho d'una altra manera, aquesta patent de programari cobreix la inmensa totalitat dels sistemes de filtrat d'spam usats avui en dia. Però els primers estudis acadèmics sobre la classificació automàtica de documents daten de bastant més enrera, dirigits des de les branques científiques del data mining i la intel·ligència artificial.
Per exemple, un dels estudis i implementacions que feia ús del teorema de Bayes per a determinar a quin grup pertanyia un document és d'en Charles Ling, doctor per la Universitat de Pensilvània, conjuntament amb altres i al voltant de l'any 2000. Emperò degut a problemes col·laterals en la tria dels tokens sobre els quals van realitzar els càlculs, resultà ser que els antics algoritmes genètics eren més exactes que els probabilístics. L'assumpte va quedar aparcat fins al 2002, amb l'arribada creixent de l'spam amb els correus electrònics i un article d'en Paul Graham, del MIT, que ens recordà que els filtres probabilístics podrien funcionar bastant bé en aquest cas (i així ha estat, unit a un refinament de la tècnica).
Ara tot aquest coneixement està en mans d'una empresa multinacional, que dit sia, no ha estat precisament el motor de la innovació en aquest camp. S'haurà de veure de quina manera protegeixen la seva patent, si es que la poden conservar, i què passarà amb les decenes d'aplicacions que empren els mètodes anteriors. Jo per la meva banda, esper que a Europa els polítics aixequin el cap i no aprovin les patents al programari. Per a tal affer, un bon cop de mà és col·laborar amb la Foundation for a Free Information Infrastructure i per descomptat votar un partit polític que no suporti i estigui en contra de les patents de programari.