Comments
Description
Transcript
Big Data and Smart Analytics
Corso di Sistemi Telematici Prof. Dino Giuli A.S. 2015-2016 Seminario Big Data & Cognitive Computing Approfondimento sulle tematiche e su alcuni strumenti IBM 02.11.2015 Chi siamo Ing. Giulia Adembri Project manager Fondazione ICON Ing. Gabriele Guidi – Reserch fellow , PhD Student DINFO-UNIFI, Collaborator Fondazione ICON Fondazione ICON (International Center Of computational Neurophotonics) - Organizzazione di ricerca no-profit, costituita nel luglio del 2011 Fondazione ICON – Sviluppo di algoritmi di intelligenza artificiale • CytoCAD – Cytology Computer Aided Diagnosis • SImple heaRT (SIRT) – sistema telematico per il monitoraggio di pazienti affetti da scompenso cardiaco – Applicazione e personalizzazione di strumenti IBM • Dic. 2013 – Accordo quadro Fondazione ICON – DINFO- IBM Sistemi Telematici Prof. D. Giuli • Assegnazione e tutoraggio di tesine che comprendano l’utilizzo di strumenti IBM Watson STAGE IBM WATSON LAB Premi per stage su tematiche di Analytics e Cognitive Computing, basato sull’impiego di strumenti IBM Watson: • IBM Watson Analytics • IBM Watson Developer Cloud Iniziative Big Data, Analytics & Cognitive Computing della Fondazione ICON 2014 • Per IBM Italia Studio di fattibilità per la gestione dei Big Data neuroscientifici sviluppati per lo Human Brain Project Flagship 20132022 • Per CsaVRI Unifi Studio di fattibilità per l’applicazione di strumenti di smart analytics, nell’ambito del progetto IMPATTO 2015 • Stage Watson Lab, borsa di studio per studenti DINFO che sviluppino casi d'uso per gli strumenti IBM Watson Developer Cloud e IBM Watson Analytics • Sviluppo concepts per applicazione • Progetto MIUR SiiMobility – sviluppo di algoritmi di data analytics bioinspired per servizi ai cittadini (in attesa di avvio) Cosa si intende per BIG DATA? Big Data definitions • • • • • • “datasets whose size is beyond the ability of typical database software tools to capture, store, manage, and analyze,” (McKinsey Global Institute, Big data: The next frontier for innovation, competition, and productivity, 2011 ) “data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges.” (Oxford English Dictionary, 2013) “The ability of society to harness information in novel ways to produce useful insights or goods and services of significant value” and “…things one can do at a large scale that cannot be done at a smaller one, to extract new insights or create new forms of value.” (V. Mayer-Schönberger and K. Cukier, Big Data: A Revolution that Will Transform How We Live, Work, and Think, 2013) “The set of technical capabilities, processes, strategies and skills for continuously converting vast, fast, varied data into Right Data to obtain actionable insights and foresights” (GROUP 2 UNIVERSITY/PUBLIC-DRIVEN APPLICATIONS, World Summit on Big Data and Organization Design, Université Panthéon - Sorbonne Paris, 2013) “an all-encompassing term for any collection of data sets so large and complex that it becomes difficult to process using on-hand data management tools or traditional data processing applications.”(Wikipedia, 2014) Big data is a broad term for data sets so large or complex that traditional data processing applications are inadequate. Challenges include analysis, capture, data curation, search, sharing, storage, transfer, visualization, and information privacy. The term often refers simply to the use of predictive analytics or other certain advanced methods to extract value from data, and seldom to a particular size of data set. Accuracy in big data may lead to more confident decision making. And better decisions can mean greater operational efficiency, cost reduction and reduced risk. (Wikipedia, 2015) The four V’s of BIG DATA BIG DATA SOURCES • 3 main contexts: • The large data collections of “big science” projects • in traditional data warehouse or database formats • The enterprise data of large, non-Web-based companies (IBM, TATA, etc.) • Generally in multiple format • The data holdings of a Google, Facebook, Twitter, Apple, Alibaba or other large Web company • Include large “unstructured” holdings • Include “graph” data • 4th context: Broad Data • The huge amount of freely available, but widely varied, Open Data on the World Wide Web (Structured and Semi-structured) • Example: The extended Facebook OGP graph (the part outside Facebook’s datasets) • Example: The growing linked open data cloud of freely available RDF linked data • Example: Hundreds of thousands of datasets that are available on the Web free from governments around the world Big Data Analytics Hadoop • • • • • • • • Framework per applicazione distribuite sistema di calcolo MapReduce distribuito per processi di tipo batch, maneggia terabyte o petabyte di dati distribuiti su diversi servers (cluster). MapReduce: i dati iniziali sono una serie di record che vengono trattati singolarmente da processi chiamati Mapper e successivamente aggregati da processi chiamati Reducer. Hadoop è stato sviluppato sulla base del Google File System (GFS): Hadoop Distributed File System (HDFS). Nell'HDFS di Apache Hadoop ogni file è diviso in bocchi di dimensione fissa di 64 MB e questi blocchi sono replicati in maniera ridondante (2 o 3 volte) nei server del cluster. NameNode è un server che gestisce la logica di allocazione dei dati nel cluster tramite metadata dei files. E' un server critico perché unico. File systems classici dividono in 512 B, mentre i DB in blocchi che vanno da 4 KB a 32 KB. Hadoop Common, un set di librerie che supportano le varie versioni di Hadoop. Hadoop MapReduce APIs sono principalmente chiamate da Java Alcuni progetti collegati ad Hadoop • • • • • • • Apache Avro for data serialization Cassandra and Hbase: databases Chukwa: a monitoring system specifically designed with large distributed system in mind Hive: provides ad hoc SQL-like queries for data aggregatio and summarization Mathout: a machine learning library Pig: a high-level Hadoop programming language that provides a data-flow language and execution framework for parallel computation Jaql: Query Language for JavaScript Object Notation (JSON) Strumenti IBM • Watson: Semantic Web Technology, enhanced by a massive use of open linked data, plays a crucial role in the overall Deep QA architecture • • • find and locate ontologies and semantic data online explore the content of these semantic documents - NLP (Natural Language Processing) InfoSphere BigInsights Platform (Hadoop): business and smart analytics instrument to Search and explore, Analyze and visualize, Aggregate and extract o o o o o o Big Data Analytics Data Warehousing Data Security & Privacy Information Integration Lifecycle Management Master Data Management Big Data Enterprise Engine: o o InfoSphere Streams (streaming Analytics) Infosphere BigInsights (Internet Scale Analytics) Cosa fa Watson • • • Con Watson si possono costruire applicazioni Web semantiche, tramite le APIs Watson, sviluppate secondo i requisiti del nuovo WEB Semantico, che forniscono l’accesso a varie funzionalità con servizi on-line (Web Services). L’accesso alle funzionalità, al contrario di altri motori di ricerca del Web Semantico, è illimitato. Librerie Java- servizi SOAP per: • Ricerca di ontologie e documenti semantici legate a particolari ambiti o concetti • Ricerca all’interno delle ontologie e documenti semantici • Recuperare metadati concernenti un’ontologia • Recuperare metriche da ontologie ed entità • Sfruttare il contenuto di ontologie • Fare queries SPARQL (SPARQL Protocol and RDF Query Language) tramite Web Interfaces • Risorse • RDF (Resource Description Framework), Linked Data • URI: Google, Swoogle4, PingTheSemanticWeb5, URLs manuali NPL • Language Identification • Lexical Analysis • Classification • Disambiguation • Entity Extraction • Fact Extraction • Concept Extraction • Relationship Extraction • Inferencing Architettura di Watson • • • First discovered through a crawling and tracking component, using Heritrix, the Internet Archive’s Crawler Validation and Analysis component is then used to create a sophisticated system of indexes for the discovered documents, using the Apache Lucene indexing system3 Based on these indexes, a core API is deployed that provides all the functionalities to search, explore and exploit the collected semantic documents. This API also links to the Revyu.com Semantic Web based reviewing system to allow users to rate and publish reviews on ontologies Applicazioni di Watson Healthcare: • • INPUTs: electronic medical record, dati diagnostici, dati clinici, stato dell’arte sui trattamenti OUTPUTs: diagnosi, trattamento ottimizzato in base alla storia clinica del paziente (radiazioni, chemio, intervento chirurgico) Phases: • pre-processing • NLP in Healthcare: analysis of text (ex. medical report): • Content Analysis • Post-processing 14.nov. 2013 - IBM mette a disposizione la tecnologia Watson per creare una nuova generazione di app – Watson <cloud service Infosphere BigInsights • Cos’è: piattaforma basata sul software framework Apache Hadoop, per Big Data. • Cosa fa: • offre funzionalità di data mining e analytics su dati “at rest” complessi (strutturati e non) su larga scala, con funzionalità di sicurezza, performance e affidabilità adatti a workflow aziendali. 20 applicazioni predefinite e 2 acceleratori. Console di visualizzazione. Supporta il Lightweight Directory Access Protocol (LDAP) per aut. Console. Connettori per le principali piattaforme di data warehouse IBM (DB2, Netezza) e non, che consentono di pescare I dati da DB no-SQL • I cluster di BigInsight, basati su GPFS (General Parallel File System – Shared Nothing Cluster) anziché su HDFS (Hadoop Distributed File System) di Hadoop, permettono scritture random su file già esistenti nel cluster, oltre a quelle “append” • Campi applicazione principali: • Aziende pubbliche e private per il supporto alle decisioni Infosphere Streams • Cos’è: piattaforma basata sul software framwork Apache Hadoop, per Big Data. • Cosa fa: abilita l’elaborazione massiva di flussi di dati per avere analisi in tempo reale • Campi applicazione principali: • Aziende produttrici/distributrici/dettaglianti per integrare informazioni di acquisto della clientela con sentiment analysis sui social media Opinion mining A sub-discipline of computational linguistics that focuses on extracting people’s opinion from the web. The recent expansion of the web encourages users to contribute and express themselves via blogs, videos, social networking sites, etc. All these platforms provide a huge amount of valuable information that we are interested to analyse. Given a piece of text, opinion-mining systems analyse: · Which part is opinion expressing; · Who wrote the opinion; · What is being commented. Rif. D. Osimo, F. Mureddu “Research Challenge on Opinion Mining and Sentiment Analysis” Sentiment analysis Sentiment analysis, on the other hand, is about determining the subjectivity, polarity (positive or negative) and polarity strength (weakly positive, mildly positive, strongly positive, etc.) of a piece of text – in other words: · What is the opinion of the writer Rif. D. Osimo, F. Mureddu “Research Challenge on Opinion Mining and Sentiment Analysis” Big Data nel mondo del business • Obiettivo: Trasformare enormi volumi di dati di vario tipo in informazioni e conoscenza utili per prendere decisioni aziendali mirate • Strumenti: piattaforme IT che raccolgono e analizzano i big data ed estraggono info personalizzabili tramite content analysis, data mining e smart analytics • Sorgenti big data: archivi informatici aziendali (database e filesystems), blog & social media, dati internet delle grandi web company Potenzialità dei Big Data • Integrare il Business con la Tecnologia ->smart analytics • Utilizzare dati storici e di sintesi, strutturati e non • Trarre il massimo profitto dall'analisi delle informazioni estratte da tutte le fonti disponibili->drill down&drill through big data BigData issues • Con i BigData problemi che nei dati comuni sono trascurabili, diventano criticità • Esempio: le Operazioni di I/O • Infatti con il calcolo distribuito e Grid HPC la computazione non è più un problema, gran parte del tempo del processo viene impiegato in operazioni su Disco!!! BigData issues • Quindi sono state sviluppate tecnologie che permettono di Analizzare stream di dati SENZA doverli salvare. • Ovvero vengono analizzati e l’informazione viene estratta AL MOMENTO della scrittura, non prima salvati e poi analizzati. • Come risultato ho che a fine processo avrò le informazioni su quei dati senza averli fisicamente salvati in nessun datacenter ma analizzati come flusso BigData issues • Si pensi ad esempio ad un flusso di dati proveniente da twitter • La sorgente dei dati è “senza fine”, ovvero nel tempo impiegato per salvare un certo tot di dati, la sorgente ne ha già riprodotti altrettanti. • Analizzo quindi il “flusso”, non dati salvati. BigData issues • Nel mondo IBM il pacchetto InfoSphere offre il software “Stream” che affronta il problema dei BigData esattamente come descritto • L’ambiente permette di costruire un flusso di analisi e scrivere codice (c, c++, altri linguaggi) in blocchi funzionali • Il framework poi parallelizza l’analisi trasformandola da analisi tradizionale ad analisi “del flusso” Alcuni esempi di ambiti applicativi applicativi Ambito applicativo Brand Monitoring La smart analytics su blog, piattaforme di customer care e canali social media in questo ambito consente: • analisi del comportamento di acquisto del cliente • valutazione della percezione del proprio brand o di uno specifico prodotto • valutazione del servizio alla propria clientela • Profilazione e design nuovi prodotti • Adeguamento tempestivo dei prodotti alle tendenze di mercato (marketing/trends) Ambito applicativo Banking/Insurance La smart analytics su blog, piattaforme di customer care e canali social media in questo ambito consente: • emersione comportamenti anomali, fraudolenti o non aderenti alle politiche aziendali • monitoraggio • valutazione del servizio alla propria clientela Trends monitoring Marketing & tendenze • Strumenti per monitorare e visualizzare graficamente le tendenze on-line in realtime • Correlazione trend/sviluppo prodotti • Smart Analytics, Analisi semantica e Machine learning per analizzare Big Data originati su social media, blogs e forums I tacchi si abbassano in tempi di crisi? Nascita di una tendenza: Cycle Chic Pedalare con stile Il look dei ciclisti chic si propaga sui fashion blog e sulle principali città del mondo creando un nuovo settore di business Propagazione fenomeno Cycle chic 2007 • Diffusione: blog Copenhagen ->blog Berlino • Business: Cycle chic si diffonde prima nelle città con forti comunità artistiche Propagazione fenomeno Cycle chic 2008 • Diffusione: Stoccolma, Portland, Los Angeles • Business: nuove aziende di biciclette e abbigliamento casual per bici (UK, USA, D) Chatters on-line +228% (2007) Propagazione fenomeno Cycle chic 2009 • Diffusione: USA, Nord EU, Singapore • Business: emerge lo stile tweed, aumentano eventi e brands per ciclisti urbani Chatters on-line +210% (2008) Propagazione fenomeno Cycle chic 2010 • Diffusione: Buenos Aires, Johannesburg, Shangai, Mexico City, Tokio, Australia • Business: nasce il Bristol Cycle Festival Chatters on-line +274% (2009) Propagazione fenomeno Cycle chic 2011 • Diffusione: Mosca, Ottawa, Bogota, Parigi • Business: nuove aziende di sneakers per bici, grandi firme si dedicano al settore Chatters on-line +159% (2010) Propagazione fenomeno Cycle chic 2012 • Diffusione: 100 blogs associati a Cycle Chic • Business: le bici entrano nelle settimane della moda di NY e Londra Chatters on-line +170% partial year (2011) Alibaba phenomenon • biggest online commerce company, 80% of China's online shopping market is dominated by Alibaba Some IBM cases stories Home Connexion S.r.l. Figino Serenza (Como), Italy Desing prodotto, marketing, vendite allestimento vetrine per la casa madre Pacific International Group Analisi e pianificazione dello scenario per prevedere la domanda futura, mantenendo livelli di approvvigionamento e magazzino sotto controllo • Esigenza aziendale: difficoltà nel prendere decisioni critiche su vendite e volumi di produzione e magazzino • Soluzione: analisi sofisticate e pianificazione scenari per far fronte alla domanda fluttuante • Vantaggi: puntualità delle consegne (+98%), migliori relazioni con i fornitori (tracking efficiency) e visione più accurata della pipeline di vendita RCI Banque España Spain Finanziaria di Renault, Dacia, Nissan in Spagna e Portogallo Integrare il CRM (Customer Relationship Management) Oracle, per costruire campagne di marketing personalizzate e aumentare la redditività • Esigenza aziendale: Fronteggiare il rischio che i clienti scelgano altri competitors alla scadenza dei contratti • Soluzione: Analizzare le preferenze dei clienti ed il ciclo di vita dei prodotti tramite la piattaforma Oracle cloud (SaaS) • Vantaggi: Segmentazione del customer care in base a profitto, importo e fedeltà Kaffee Partner vendita al dettaglio Germania/Austria Sistemi di produzione caffè per casa/ufficio con particolare cura del design Aumentare l’efficacia delle campagne di marketing, per consolidare ed aumentare la clientela • Esigenza aziendale: Ottimizzare i costi delle campagne di vendita e marketing, soddisfare i clienti esistenti ed attrarne di nuovi • Soluzione: Analizzare le abitudini di acquisto dei clienti e generare report di vendita automaticamente • Vantaggi: campagne marketing appropriate con aumento del portafoglio clienti, risparmio risorse uomo per analisi di performance GKN Driveline vendita al dettaglio Germania/Austria Sistemi di produzione caffè per casa/ufficio con particolare cura del design Aumentare l’efficacia delle campagne di marketing, per consolidare ed aumentare la clientela • Esigenza aziendale: Ottimizzare i costi delle campagne di vendita e marketing, soddisfare i clienti esistenti ed attrarne di nuovi • Soluzione: Analizzare le abitudini di acquisto dei clienti e generare report di vendita automaticamente • Vantaggi: campagne marketing appropriate con aumento del portafoglio clienti, risparmio risorse uomo per analisi di performance Infosphere Platform Examples Solution description technology to study complex environment interactions between communities and ecosystem End user/customer Beacon Institute Type of analytics predictive analysis deliver instantaneous people search from IBM BluePages (600'000 people) IBM Information Management flexible queries and result as fast as possible improving service means listening to customers and gathering thousands Hertz of comments via web, email and text message KTH - Royal Institute of identify traffic pattern technology providing a platform (SmartBay) for technology development, delivering Marine Institute Ireland information and services for many users (harbormaster, fishermen, researchers, tourism officials, etc.) helping on-line retailer deliver the web experience their customers wants Technovated Content analytics traffic management Ocean information management in near real-time business intelligence improve customer care with data analytics in real-time protection and monitoring of critical infrastructure streaming data technology supports covert intelligence and surveillance TerraEchos sensor systems. IBM solutions help the ADELOS system (which detect, classify, locate and track potential threats) to analyze the data streaming and to match the sound patterns Leveraging key data to provide proactive patient care starting 12 to 24 University of Ontario Smarter healthcare Institute of Technology hours before any overt sign of trouble, almost undetectable changes begin to appear in the vital signs of infants who have contracted this infection Holds the potential to give clinicians an unprecedented ability to interpret vast amounts of heterogeneous data in real time, enabling them to spot subtle trends Strumenti di content analytics Watson analytics Watson Analytics • Watson Analytics: piattaforma web che permette di: – impostare un’analisi di dominio: es. analisi vendite – caricare database in forma di testi strutturati esportati o files Excel per quell dominio – impostare una parola chiave o una domanda sul target dell’analisi (es. vendite) – estrarre la conoscenza, rispetto al target, in forma di relazioni/regole. Es.: • regola a. % vendite alte per ‘abbigliamento infante’+ ‘acquirente femmina’+ ‘forte sconto’, • regola b. % vendite bassissime per ‘abbigliamento maschile’ + ‘acquirente femminile’ + ‘forte sconto’ , • regola c. %vendite basse per ‘accessori’ + ‘femmina’ + ‘forte sconto’ etc. Watson Analytics – rappresentare le regole estratte in forma di infografica (v. Figure 1, Figure 2, Figure 3) – fare infografica multitarget: es. vendite+profitto-> rispetto al profitto: volume vendite con forte sconto risulta in perdita (profitto negative), mentre vendite basse ma con poco o nessuno sconto crea molto profitto (v. Figure 3) Watson Analytics Es. di infografica per visualizzare le regole individuate da Watson, rispetto alle categorie di prodotto.: GENDER: Female/Male è riferito all’acquirente. DISCOUNT: Large/Moderate/Small or None è riferito all’acquisto. Nella barra superiore vi sono le miniature di altri tipi di estrazioni/grafici suggeriti. Watson Analytics Figure 2 Vendite per categorie di prodotto. Watson Analytics Figure 3: Vendite per categorie di prodotto correlate al profitto-> abbigliamento bambino + venduto ma in perdita. Accessori hanno minor volume di vendite, ma alto profitto. IBM Watson powered applications IBM Watson cognitive computing • 2013: Watson aiuta un importante centro oncologico ad accelerare il trasferimento della conoscenza dalla ricerca alla pratica • Gen 2014: IBM annuncia nuovi Watson Services, erogati in modalità cloud, tramite la piattaforma Bluemix, per trasformare la Ricerca e lo Sviluppo industriale, visualizzare insight sui Big Data e alimentare l'esplorazione analitica • 2015: Bluemix si propone come una piattaforma Cloud per lo sviluppo di applicazioni che utilizzano servizi basati su Watson WATSON COME SERVICE • Watson necessita come tutti i sistemi di intelligenza artificiale di una fase di train. • Sono disponibili alcuni domini su cui Watson è già addestrato (Bluemix) altrimenti è necessario un processo di addestramento special purpose per il dominio di interesse. • Il punto di forza di Watson è lavorare sul linguaggio naturale, analizzando non soltanto le singole parole o singole frasi ma tutto il contesto in cui esse vengono pronunciate/scritte. • Da inizio 2014 Watson è offerto come Service Web integrabile in vari applicativi. • Si passa da Cognitive products a Cognitive Systems. • In qualsiasi applicazione che sia connessa ad internet è quindi possibile inserire un pulsante personalizzato "Ask to IBM Watson" per poter accedere in tempo reale al servizio. CASO D'USO 1 - WATSON CHEF CASO D'USO 1 - WATSON CHEF • Watson è stato addestrato con conoscenze di cucina. • NON è soltanto un sistema che dati alcuni ingredienti disponibili calcola la ricetta fattibile con essi. • Infatti è addestrato con dati relativi a ricette tipiche regionali, ma anche nozioni relative ai vari sapori, a quale sapore sta bene con un altro, con nozioni di psicofisica edonica, nozioni di chimica. • Questo porta il sistema Watson Chef a saper CREARE nuove ricette gradevoli al palato umano • In particolare, può creare la ricetta (inedita) più adeguata per ogni singolo individuo prendendo alcuni dati di profilazione utente (nazionalità, mi piace di più salato o dolce, piccante, sono vegetariano, etc...) CASO D'USO 2 - WATSON ASSISTENTE AGLI ACQUISTI • Watson funge in questo caso da addetto alle vendite (esempio di scarpe), scegliendo il modello più appropriato per un certo utente. Anche in questo caso l'analisi del linguaggio naturale è fondamentale per incorporare le varie informazioni che altri utenti condividono e le domande che solitamente gli utenti fanno ai commessi umani. CASO D'USO 3 - WATSON ASSISTENTE DI VIAGGIO CASO D'USO 3 - WATSON ASSISTENTE DI VIAGGIO Servizio al passeggero: Watson aiuta a scegliere e pianificare le proprie vacanze. L'utente chiede a Watson in linguaggio naturale qualcosa del tipo: "Voglio andare in vacanza con mia moglie e i miei due figli in un posto caldo, per una settimana ad aprile". Watson elabora il tutto e propone Località, hotel disponibili, aereo, taxi per arrivare all'aeroporto etc...". Grazie ad una attenta profilazione utente Watson è in grado in tutto il percorso di offrire sempre cose gradite al cliente, esempio: se l'aereo è in ritardo offre un buono pasto gratis Italiano Use cases sviluppati al DINFO con la Fondazione ICON Fondazione ICON: Bluemix e Watson, scenari di utilizzo 8 ottobre 2015 Incubatore Universitario Fiorentino Overview degli scenari di utilizzo Bluemix e Watson: Tesine Studente Argomento Tecnologia IBM Ricadute/interconnessioni Giovanni Journey in Florence – app Bluemix + Personality Grieco+ turistica con profilazione Antonio Insight personalità Passaro Bando EU SOUL-FI Accelerator call Round B: TRIP - journey tutor based on TouRIst Personality with high degree of privacy Dyrecta Lab srl + Fondazione ICON Matteo Mazzola Pubblicazione in Future Internet Journal – special Issue «Ecosystemic Evolution Feeded by Smart Systems” Prof. Giuli Guest Editor ECG come predittore dello scompenso cardiaco Watson Analytics Overview degli scenari di utilizzo Bluemix e Watson: Stage Studente # Argomento Roberta Rossi Tecnologia IBM Ricadute/interconnessioni Watson Analytics Progetto DINFO-AOU Careggi 2 Dataset di personalità Bluemix + Personality Insight Proposta FI-WARE SOUL-FI 1 H2020 call finder Bluemix + Natural Language Classifier 1 Andrea Accogli 2 Iacopo Girolami Predizione outcomes Terapia Intensiva Estrazione parametri diario clinico 1 AntiSPAM SMS Bluemix + Relationship Extraction Bluemix + Natural Language Classifier 2 Virtual chat for emergency Bluemix + Dialog Integrabile in portali su progettazione EU o per uffici di supporto alla progettazione Parametrizzazione parametri terapie (Progetto DINFO-AOU Careggi) Ricerca DINFO su farmaci LASA Back-end app mobile Call center virtuale con integrazione servizi text<->speech Journey in Florence Applicazione mobile per un’offerta turistica profilata sulla personalità utente tramite il servizio IBM WATSON Personality Insights • Prototipo APP Android. Le funzionalità dell’applicazione sono: – Determinazione del profilo dell’ utente tramite il servizio IBM WATSON Personality Insight, con il metodo «Big Five», analizzando un testo scritto dall’utente. – Suggerimento automatico dei luoghi in base alla personalità dell’utente. – Pianificazione di un itinerario da parte dell’utente e navigazione verso i luoghi selezionati. – Valutazione dei luoghi visitati. – Caratterizzazione del territorio (profilo di personalità del territorio) basata sul giudizio espresso dall’utente. Journey in Florence Risultati: Analisi Short-Term Coppia predittiva LF/HF e pNN20 con potere predittivo del 92% H2020 Call Finder • L’ambito di classificazione dei progetti scelto è quello del programma Horizon2020. • La gerarchia che costituisce la struttura in cui vengono catalogati dei progetti in un programma è la seguente: Programme Main Pillar Challenge Call H2020 Societal Challelnges Environme Energy nt Waste Water FP7 Excellence Sciences Food SC5 Industrial Leadership Health Transport L’applicazione: schema di funzionamento 5 Predizione outcomes per Terapia Intensiva Ricerca di predittori connessi a parametri utili alla gestione del reparto di terapia intensiva utilizzando il servizio IBM Watson Analytics USE CASE 1: Antispam SMS (a regime) Connessione al servizio SMS text ricevuto Spam or Human SMS 72/10 Realizzazione Servizio Antispam Codice cUrl per dataset Training API Rest Dataset SMS 73/10