Il formato PDF, creato da Adobe nel 1993, è estremamente popolare per i documenti, ma rappresenta una sfida per i sistemi di intelligenza artificiale. Sebbene i PDF siano progettati per essere letti dagli esseri umani, la loro struttura complicata, come colonne, grafici e tabelle, rende difficile l'analisi automatica. I programmi di intelligenza artificiale devono utilizzare tecnologie di riconoscimento ottico dei caratteri (OCR) per estrarre il testo, ma incontrano difficoltà con documenti complessi. Al contrario, formati come HTML sono più facili da analizzare grazie ai tag che indicano la struttura del documento.
Le limitazioni dei PDF influenzano sia gli utenti, che hanno difficoltà ad analizzarli, sia le aziende di intelligenza artificiale, che non possono accedere a un grande volume di dati memorizzati in formati non strutturati. In questo contesto, startup come Factify stanno esplorando lo sviluppo di nuovi formati che combinino i vantaggi del PDF con un'analisi più facile da parte dell'IA. Inoltre, l'azienda Mistral sta lavorando a un sistema OCR basato su IA per migliorare la lettura dei documenti PDF. Sebbene il PDF rimanga lo standard dominante, la domanda per formati più amichevoli per le macchine cresce man mano che l'intelligenza artificiale diventa sempre più rilevante.
Le limitazioni dei PDF influenzano sia gli utenti, che hanno difficoltà ad analizzarli, sia le aziende di intelligenza artificiale, che non possono accedere a un grande volume di dati memorizzati in formati non strutturati. In questo contesto, startup come Factify stanno esplorando lo sviluppo di nuovi formati che combinino i vantaggi del PDF con un'analisi più facile da parte dell'IA. Inoltre, l'azienda Mistral sta lavorando a un sistema OCR basato su IA per migliorare la lettura dei documenti PDF. Sebbene il PDF rimanga lo standard dominante, la domanda per formati più amichevoli per le macchine cresce man mano che l'intelligenza artificiale diventa sempre più rilevante.
Fonti
Ultime notizie
23:05
Trump reagisce dopo la sospensione dei negoziati tra Iran e Stati Uniti: "Il silenzio sarebbe molto buono"
23:03
Condizione imposta agli sportivi russi e bielorussi dagli organizzatori di un maratona in Lituania: possono partecipare solo sotto la bandiera ucraina
22:55
Anthropic fa un passo verso la quotazione in borsa: IPO riservata depositata presso l'autorità dei mercati negli Stati Uniti
22:48
Oana Coiu denuncia al Consiglio di Sicurezza dell'ONU gli incidenti con droni russi nello spazio aereo romeno: "Queste azioni sono inaccettabili e devono cessare"
22:44
La Russia accusa la Romania di russofobia dopo l'incidente con il drone di Galați
Vedi altre notizie