Artificiali e Intelligenti

di Antonio Lieto

SearchPoint: Multiranking Engine

SearchPoint è il risultato, parziale, di un progetto di ricerca ancora in itinere iniziato nel 2007 da parte di Bostjan Pajntar e Marko Grobelnik, due brillanti ricercatori dello Joseph Stefan Institute di Lubjana (Slovenia).

Di cosa si tratta? Di un nuovo tipo di motore di ricerca multiranking. In grado di fornire, in base ai diversi sensi cui può riferirisi una keyword (o una stringa di keywords) utilizzata come query, differenti liste di risultati. Ordinate (e ordinabili) per topic.

Un semplice esempio? Immaginate di chiedere a SearchPoint una serie di informazioni digitando, come query, una chiave di ricerca vaga e ambigua come "Jaguar". Ebbene il primo risultato che vi fornirà sarà una lista di risorse web ricavate semplicemente utilizzando il ranking di Google.

Nella parte destra dell'interfaccia, però, (questa la novità) vedrete comparire un puntino rosso inserito in una rete di topics collegati alla keywords utilizzata per la  query. Tali topics (ricavati con tecniche di keyword extraction) corrispondo ad un sottoinsieme (un subset) delle diverse accezioni di significato cui la parola "Jaguar" può, in contesti diversi, riferirsi (ad es. automobile, animale, ecc.). 

Tale sottoinsieme è navigabile. E' possibile, cioè, trascinare il puntino rosso sui vari topics della rete concettuale automaticamente generata. A seconda dell'accezione su cui ci si ferma,  il "trascinamento" comporta un cambiamento di ranking (e quindi di visualizzazione dei risultati ottenuti) di tipo topic based (basato cioè sulla presentazione dei risultati con più alta corrispondenza semantica rispetto al topic su cui si è deciso di posizionare il puntino).

Per dirla con gli autori "The closer the red point is to one of the topics, more results that talk about this topic are going be on the result list".

Insomma: SearchPoint, pur essendo ancora un tool in pieno divenire e da perfezionare sotto diversi aspetti, introduce degli elementi davvero innovativi. E rappresenta, di sicuro, uno dei progetti più promettenti e interessanti per l'evoluzione "semantica" (una "semantica" guidata in questo caso) dei motori di ricerca. 

AntonioLietoNova

CyC Project

Si chiama CyC, ed è uno dei più noti progetti di ricerca nel campo dell'Intelligenza Artificiale. Iniziato nel 1984 da Doug Lenat, l'idea di fondo su cui poggia consiste nello sviluppo di una ontologia esaustiva del mondo (ossia una rappresentazione formale e machine understandable di tutti i domini conoscitivi dello scibile umano) che possa permettere, alle "macchine", di eseguire modalità di ragionamento automatico sui dati in essa rappresentati e immagazzinati.

Per avere un'idea dell'enorme estensione che dovrebbe avere tale base di conoscenza basti pensare che, una volta arrivati alla sua versione "definitiva", l'ontologia di CyC dovrebbe contenere (per ogni singolo dominio conoscitivo), una quantità e qualità tale di dati e informazioni sul mondo, da poter essere assimilabile, almeno alla lontana, alla sterminata mole di informazioni immagazzinate nella nostra mente ed utilizzate per formare la nostra stessa conoscenza.

Proprio la conoscenza, o meglio: il modo in cui essa viene rappresentata in ambienti artificiali (siano essi soft-bot o automi), è uno dei punti centrali di tutta la questione. Lo scopo ultimo di progetti come quello di CyC, infatti, consiste nel permettere, a "macchine" (o, in generale, a sistemi artificiali), di compiere ragionamenti automatici "intelligenti" in modo che siano in grado di rispondere, in maniera pertinente, a richieste fatte in input da un qualsiasi altro agente (umano o artificiale esso sia). Per riuscire a raggiungere tale obiettivo, però, è necessario rappresentare le informazioni "di scambio" tra gli altri agenti del processo di interazione, in un linguaggio comune, condiviso, riconosciuto e processabile.

Nello specifico: il mondo di CyC è fatto di concetti, mentre la "sua" conoscenza è descritta, invece, da proprietà, relazioni, asserzioni ed espressioni logiche che legano concetti ad altri concetti in una rete di senso estremamente complessa e potenzialmente senza fine (il tutto formalizzato in linguaggio CyCL: un mix tra il LISP e la logica dei predicati del primo ordine).
 
Un esempio, noto, di "pezzi di conoscenza" rappresentati in CYC è dato da asserserzioni del tipo: "Ogni albero è una pianta" e "Le piante muoiono con il passar del tempo". Ebbene: ragionando su tali asserzioni, grazie ad un proprio
motore inferenziale, CyC (questa la sua abilità), è in grado di rispondere correttamente ad una query in linguaggio naturale del tipo "Gli alberi muoiono?".

Facile, dunque, immaginare, in un'epoca in cui tanto si parla di intelligent search e retrieval semantico delle informazioni, l'enorme portata di sviluppo che può avere questo progetto. L'unico, non piccolo, problema è dato dai suoi tempi di realizzazione. Lo stesso Lenat, infatti, ha calcolato, per questo sforzo titanico di ricerca, una "durata lavori" di circa 350 anni-uomo!

Nel frattempo, sperando che Lenat, una volta tanto, abbia sbagliato a far di conto, è possibile comunque consultare una release navigabile di questa enorme base di conoscenza (dalle dimensioni minori rispetto a quella originale) che si chiama OpenCyC. Basta visitare il sito OpenCyc.org. Buon divertimento.

AntonioLietoNova

40 anni dallo Sbarco sulla Luna

Mi concedo un piccolo off-topic (neanche tanto off) per ricordare un avvenimento storico di grande importanza di cui oggi si celebra la ricorrenza. Volete una data? 20 luglio 1969. Esattamente 40 anni fa l'uomo sbarcava sulla Luna.

Tale impresa rappresenta, a tutt'oggi, anche nell'immaginario collettivo, una delle più grandi vittorie tecnologiche dell'uomo. Ottenuta grazie alla ricerca scientifica avanzata in campo ingegneristico e aerospaziale.

Nel video in basso ripropongo uno spezzone della storica telecronaca RAI dell'epoca (con Tito Stagno) che incollò ai televisori i telespettatori di tutto il Paese.

AntonioLietoNova

Wolfram Again

E' arrivato il momento del lancio ufficiale di Wolfram Alpha. Sto effettuando i primi test per cercare di capire quali sono  le reali "capacità" di questo sistema. In basso vedete la risposta, corretta, fornita alla query "President of Italy in 1982" ("Sandro Pertini").

Appena ne avrò approfondito l'utilizzo scriverò le mie impressioni in maniera più dettagliata. Per provarlo basta cliccare qui

"Testing
AntonioLietoNova

Wolfram Alpha

Tutti ne parlano da qualche mese ormai. E molti attendono con ansia di poterlo utilizzare. Stiamo parlando di Wolfram Alpha: il “motore computazionale della conoscenza” (Computational Knowledge Engine) che dovrebbe essere in grado di restituire, alle query fatte dagli utenti, direttamente delle risposte corrette (a differenza degli attuali motori di ricerca che restituiscono, invece, come output, una lista di risultati potenzialmente rilevanti riguardo il topic oggetto della query).

Una semi-rivoluzione dunque. O, come direbbe Marco Varone, la primavera dei sistemi di Question – Answer. L’elemento che maggiormente incuriosisce di questo tipo di progetto è  dato dalla logica che sta alla base della sua realizzazione: completamente diversa rispetto a quella che governa gli attuali sistemi di information retrieval utilizzati per fare ricerche sul web. Wolphram Alpha, infatti, si basa su un motore inferenziale realizzato su una mole enorme di basi di dati strutturati che, nel corso di questi ultimi anni, sono stati assemblati e puliti “manualmente” dai ricercatori del team del fisico inglese Stephen Wolfram.

Il sistema, a quanto sembra, sarà in grado anche di rispondere, in tempo reale, a domande specifiche (ad es. il valore corrente dello stock price o della temperatura di una particolare zona del globo) grazie alla sua interazione dinamica, via API, con terze parti.

Nonostante tali caratteristiche, però, Wolfram Alpha non è un sistema di intelligenza artificiale (né, stando alle parole del suo fondatore, aspira ad esserlo). Nel senso che non è in grado di “capire” gran parte delle domande che gli vengono poste e, di converso, gran parte delle risposte che fornisce. A mettere in luce alcune sue falle è stato Doug Lenat, studioso oramai leggendario del settore IA e Rappresentazione della Conoscenza (suggerisco come Guido Vetere, di leggere il suo articolo sull'argomento).

Uno dei “bugs” individuati da Lenat sta nella incapacità del sistema di “ragionare” a 2 variabili (è incapace cioè di rispondere ad una domanda del tipo: “How old was Obama when Mitterrand was elected president of France?” pur essendo in grado di rispondere, singolarmente, a domande riguardanti Obama e Mitterand). Tale incapacità è dovuta alla mancanza, nelle sue fondamenta, di un sistema strutturato di rappresentazione della conoscenza (ad es. un’ ontologia) attraverso cui sarebbe possibile rappresentare, e collegare, questi due “pezzi” singoli di informazione per tirarne fuori una terza in grado di aggiungere valore alla “conoscenza reale” inserita nel sistema stesso.

Insomma Wolfram Alpha, stando sempre alle parole di Lenat, sarebbe una via di mezzo tra Google e sistemi di intelligenza artificiale come, ad esempio, CyC. Un ibrido, dunque; che, però, potrebbe risultare molto utile per ricercare informazioni puntuali su domini specifici (ad es. sembra funzioni bene, data la base da cui è stato derivato, per rispondere ad informazioni basate su calcolo numerico). Non resta che provarlo (il lancio è previsto entro la fine del mese di maggio). Keep in touch.

AntonioLietoNova

Cadie e il Pesce Intelligente

Avete mai sentito parlare di CADIE? Stando a quei mattacchioni di Google si tratta della prima  Entità Cognitiva Autoeuristica a Intelligenza Distribuita (Cognitive Autoheuristic Distributed-Intelligence Entity).

Una tecnologia, insomma, (o meglio una "entità"), che promette di fare miracoli per il miglioramento dei servizi forniti agli utenti web.

Maggiori informazioni circa le reali capacità di CADIE sono reperibili sulla sua home page (realizzata automaticamente dal sistema). Per i più dotti, invece, è disponibile, rigorosamente in inglese, una monografia molto esaustiva.

Peccato che, come dicono gli stessi googlers, ci siano ancora numerosi bug da risolvere. Peccato, inoltre, che oggi sia il primo aprile 2009. :-).

AntonioLietoNova

Motori Semantici e Metadata per il Web del Futuro

Risale a qualche giorno fa la notizia del “lancio”, da parte di Microsoft, di Kumo, nuovo motore di ricerca “intelligente” (ancora in fase beta e il cui utilizzo è riservato, per il momento, solo ai dipendenti della casa di Redmond) che dovrebbe consentire, in futuro, agli utenti web, sia di effettuare ricerche in linguaggio naturale (digitando espressioni o frasi di senso compiuto in una o più lingue) che (qui la novità) di ricevere risposte informative altamente pertinenti sulla base delle richieste effettuate tramite query.

L’idea di riuscire a rendere più pertinenti, e quindi, in un certo senso, “intelligenti”, le riposte dei motori di ricerca a quelli che sono i reali desiderata informativi degli utenti del Web, è, sin dai suoi albori, tra gli obiettivi principali che si propone di realizzare il progetto del Semantic Web formulato da Sir Tim Berners Lee.

Per poter riuscire in quest’ impresa, incentrata sulla realizzazione di una infrastruttura di rete che permetta alle “macchine” (in questo caso i motori di ricerca) di “capire” e, quindi, per certi versi, di “interpretare” in modo automatico, il senso di una data risorsa web, si è reso necessario, in questi anni, un sostanziale ripensamento tanto dell’architettura infrastrutturale del Web stesso quanto delle modalità di recupero delle informazioni adottate dai motori di ricerca classici.

I nuovi motori, infatti, sono chiamati ad essere sempre più precisi e “semantici”. Per realizzare tale obiettivo, sono stati sviluppati, nel corso degli anni, nuovi linguaggi web, evoluzioni dell’HTML (che è sostanzialmente un linguaggio di formattazione grafica), che hanno permesso di definire una infrastruttura delle informazioni maggiormente machine understandable mediante l’utilizzo dei cosiddetti meta-data.

Linguaggi come XML, l’RDF o l’OWL, ad esempio, consentono, infatti, di definire, (e in un certo senso di “rappresentare”) al loro interno, un maggior numero di informazioni riguardanti le caratteristiche semantiche delle risorse web. Permettendo, in tal modo, ai motori di ricerca stessi, di avere a disposizione più informazioni da poter processare per decidere se una data risorsa X (ad es. una pagina web) sia o meno pertinente per una query di tipo Y formulata da un utente Z. Insomma: per la realizzazione di un "web intelligente" la strada da percorrere sembra tracciata: Semantics is the Future.   

AntonioLietoNova

Dai calcolatori elettromeccanici ai computer quantistici

La nascita dei primi calcolatori risale ai primi anni ‘40 del secolo scorso. Era il 1941, infatti, quando Konrad Zuse inventò Z3, il primo calcolatore elettomeccanico digitale programmabile la cui memoria era composta da circa 2500 relè telefonici.

Sarebbero stati sviluppati, poi, in quegli stessi anni (1943-1951), altri calcolatori via via più potenti dal punto di vista della capacità di calcolo: dal Colossus (utilizzato per decriptare la macchina tedesca Enigma durante la Seconda Guerra Mondiale), al Mark I di H.Aiken, al mitico ENIAC (1946) progettato da J.P. Eckert e J.W. Maucly (primo calcolatore elettronico general purpose della storia, con memoria a valvole termoioniche), passando per l’EDSAC del 1949 (primo calcolatore general purpose costruito con programma memorizzato), fino ad arrivare al MADM, all’EDVAC del 1951 e a tanti altri ancora.

L’elettronica, dunque, in quegli anni, aveva pian piano iniziato a soppiantare (con il passaggio dai relè alle valvole termoioniche) la tecnologia elettromeccanica, garantendo, ai primi computer, una potenza di calcolo via via crescente. Preistoria dell'informatica dunque. Senza la quale, però, la società in cui viviamo sarebbe probabilmente stata molto diversa da come la conosciamo.

Oggi, una delle sfide principali in cui sono impegnati gli scienziati dei principali laboratori del globo, riguarda la realizzazione di computer in grado di operare secondo le leggi della fisica quantistica. Dei super-computer dunque. In grado di manipolare l’informazione (misurata in qubit e non più in bit) con un'efficienza tale da poter eseguire, in tempi brevi, calcoli o affrontare problemi che anche il piú potente dei computer classici non potrebbe, per sua natura, e per suoi limiti strutturali, affrontare.

Una bella sfida. Oggi reale. Fino a soli sessant’anni fa assolutamente inimmaginabile. Fantascienza diventata scienza. 

AntonioLietoNova

Incipit


Questo spazio è dedicato al futuro. A idee, visioni, luoghi e dimensioni che appaiono lontani, ma che, forse, sono più vicini di quanto possa sembrare. 
 
Si parlerà di Intelligenza Artificiale (e dunque di innovazione). Delle ricerche più interessanti che si stanno portando avanti nei vari LAB del mondo. Delle loro reali implicazioni e prospettive. Dei risultati ottenuti e di quelli attesi.
 
Coinvolgendo, nel dibattito, matematici e filosofi, informatici e sociologi, ingegneri e psicologi. E cercando di tenere bene a mente il celebre quesito posto da Alan Turing nel saggio  "Computing Machinery and Intelligence" del 1950: can a machine think? Staremo a vedere. Intanto...Benvenuti.
AntonioLietoNova

Naturalmente macchine. E dunque sistemi. E quindi ricercatori, innovatori, visionari  che con le macchine e i sistemi interagiscono ogni giorno. Per esplorare non solo il mondo in cui viviamo. Ma anche ciò che siamo.  

Un laboratorio trasversale. Un passo oltre il confine. La fantascienza che si fa scienza. Benvenuti.