mastodon.ie is one of the many independent Mastodon servers you can use to participate in the fediverse.
Irish Mastodon - run from Ireland, we welcome all who respect the community rules and members.

Administered by:

Server stats:

1.8K
active users

#ocr

4 posts4 participants0 posts today

Lilbits: Cybersecurity funding, single-board PCs for AI, saving text from screenshots, and Linux on MacBooks

For more than two decades the US government has funded the CVE Program, which tracks and publicly discloses cybersecurity vulnerabilities in a uniform manner. But this week it looked like the federal contract that funds the organization could be set to expire, which could have had a pretty serious impact on global cybersecurity efforts.

That didn’t happen – the US has extended funding for at […]

#ai #asahi #cve #Cybersecurity #dragonwing #fedoraAsahiRemix #lilbits #meigPi #meigSmart #ocr #qualcommDragonwing #radxa #radxaDragonQ6a #sbc #snippingTool #windowsSnippingTool

Read more: liliputing.com/lilbits-cyberse

Anyone who is blind, or who has worked with the blind, knows how expensive our technology can be. This couldn't be more true with relation to braille displays. Even the cheapest costs at least $799, and it's already behind the newest in that line, at $899. This is the Orbit Reader 20 and 20+. Now, a student in India wants to change that by creating a display that is truly affordable (under $50)! Please pass this on, so that we can give him greater recognition within the blind community. Even if it costs a bit more than he initially suspected it would, there is no excuse for the $2,000 to $5,000 average price of such technology when cheaper alternatives can be designed! He is determined to bring this to market, so let's help him do it and show our appreciation for his hard work on this life-changing project!

forbes.com/sites/kevinanderton…

Forbes14-Year-Old Boy Invents Digital Braille Reader And Wins $3,500He is in the ninth grade and has a passion for engineering and helping others. He had a goal of creating a digital braille reader for less than $50 and he succeeded.
Anyone who is blind, or who has worked with the blind, knows how expensive our technology can be. This couldn't be more true with relation to braille displays. Even the cheapest costs at least $799, and it's already behind the newest in that line, at $899. This is the Orbit Reader 20 and 20+. Now, a student in India wants to change that by creating a display that is truly affordable (under $50)! Please pass this on, so that we can give him greater recognition within the blind community. Even if it costs a bit more than he initially suspected it would, there is no excuse for the $2,000 to $5,000 average price of such technology when cheaper alternatives can be designed! He is determined to bring this to market, so let's help him do it and show our appreciation for his hard work on this life-changing project!

https://www.forbes.com/sites/kevinanderton/2024/11/30/14-year-old-boy-invents-digital-braille-reader-and-wins-3500/

#access #ACB #accessibility #affordability #blind #braille #BrailleDisplays #children #education #employment #independence #India #learning #NFB #ocr #parent #reading #science #school #students #teachers #technology #work #writing
Forbes14-Year-Old Boy Invents Digital Braille Reader And Wins $3,500He is in the ninth grade and has a passion for engineering and helping others. He had a goal of creating a digital braille reader for less than $50 and he succeeded.

So if you’re using Mastodon on the web, you can press the ⚠️ALT button and then follow the “Detect text from picture” link.

On Mac/iOS, you can select text on images as if they were text by clicking/tapping and dragging and paste that in (might be more accurate; that’s what I did).

PS. This was meant to be a reply to mastodon.social/@fatbrit/11421 but somehow didn’t get threaded correctly (was using the web client instead of Mona. I somehow manage to do that there sometimes. Has happened before.) :)

TechCrunch: Mistral adds a new API that turns any PDF document into an AI-ready Markdown file. “On Thursday French large language model (LLM) developer Mistral launched a new API for developers who handle complex PDF documents. Mistral OCR is an optical character recognition (OCR) API that can turn any PDF into a text file to make it easier for AI models to ingest.”

https://rbfirehose.com/2025/03/23/techcrunch-mistral-adds-a-new-api-that-turns-any-pdf-document-into-an-ai-ready-markdown-file/

ResearchBuzz: Firehose | Individual posts from ResearchBuzz · TechCrunch: Mistral adds a new API that turns any PDF document into an AI-ready Markdown file | ResearchBuzz: Firehose
More from ResearchBuzz: Firehose

Oh wie cool, es gibt jetzt hier an der Uni #Bamberg ein Projekt zur Struktur- und Inhaltserkennung für historische #Tabellen #OCR fis.uni-bamberg.de/handle/unib

fis.uni-bamberg.deAufbau und Bereitstellung eines Benchmark-Datensatzes von historischen Tabellen (1750-1990)BenchmarkDatensatz [2025-03-01 - ] Tabellarisch strukturierte Quellen spielen in der Sozial- und Wirtschaftsgeschichte sowie in anderen historisch arbeitenden Geisteswissenschaften eine zentrale Rolle als Datenlieferanten. Während in den letzten Jahren die KI-gestützte Texterkennung angewandt auf narrative Quellen rasante Fortschritte verzeichnen konnte, hinkt der Bereich der KI-gestützten Struktur- und Inhaltserkennung von historischen gedruckten Tabellen, noch stark hinterher. Tabellarisch aufgebaute Nachschlagewerke mit einer zentralen Bedeutung für die Sozial- und Wirtschaftsgeschichte, wie etwa Preiskuranten, Bevölkerungstabellen, oder Nachschlagewerke für den kaufmännischen Gebrauch, sind zwar als Digitalisate verfügbar, aber aufgrund ihrer komplexen tabellarischen Struktur kaum umfassend auswertbar. Im jetzigen Status Quo ist die KI-gestützte Bearbeitung von historischen Tabellen bestenfalls teil-automatisiert, in der Nachbearbeitung zeitaufwendig, und aufgrund der Vielfalt und Komplexität historischer Tabellen kaum skalierbar. Vorhandene Tools, wie etwa das in der Beta-Version verfügbare Tabellenerfassungstool von Transkribus, bieten entweder für ein bestimmtes, konsistentes Tabellenformat eine Lösung oder müssen händisch auf Tabellen angewandt werden. Das Projekt setzt sich zum Ziel, die KI-gestützte automatische Struktur- und Inhaltserkennung von historischen Tabellen wesentlich zu verbessern. Um dieses Ziel zu erreichen, planen wir den Aufbau und die Bereitstellung eines Benchmark-Datensatzes von gedruckten historischen Tabellen aus dem Zeitraum von 1750 bis 1990 – von der frühstatistischen Zeit bis zu den Anfängen des WWW, der die Vielfalt und die historische Entwicklung von tabellarischen Datenrepräsentationen abbildet und die Merkmale der Tabellen in Labels (Annotationen) erfasst. Wir planen mit einem Umfang von ca. 10.000 Tabellenseiten, und streben eine Verteilung an, die der relativen Bedeutung der Jahrhunderte in unserem Zeitraum entspricht (15% 1750-1800; 30% 1800-1900 und 55% 1900-1990). Wir widmen uns ausschließlich gedruckten ganzseitigen, doppelseitigen und mehrseitigen Tabellen und Tabellenwerken (d.h. Büchern, die (fast) ausschließlich aus Tabellen bestehen). Im Rahmen der ICDAR, die International Conference on Document Analysis and Recognition, fand zuletzt 2019 einen Wettbewerb zu einem Benchmark-Datensatz mit gedruckten und zum Teil sogar einigen handgeschriebenen archivalischen Tabellen statt. Auch in anderen Konstellationen wurden Benchmark-Datensätze (z.B. TableBank und PubTables-1M) für die Struktur- und Inhaltserkennung von Tabellen entwickelt und getestet, an denen wir uns für die Beantwortung von methodischen, technischen und infrastrukturellen Fragen orientieren werden. Mit unserem annotierten Benchmark-Datensatz werden zum ersten Mal überhaupt Trainingsdaten im großen Umfang zur Verfügung stehen, anhand dessen die Entwicklung von neuen informatischen Lösungen für die Erschließung von historischen Tabellenbeständen erprobt und ausgewertet werden kann. Das streben wir gezielt an, indem wir uns mit einem Wettbewerb für die Teilnahme an der ICDAR Konferenz in Wien 2026 bewerben werden. Für den Aufbau und die Bereitstellung des Benchmark-Datensatzes orientieren wir uns an Best Practices im Bereich der Tabellenerkennung in den Computer Sciences. Zum Benchmark-Datensatz stellen wir ein Evaluationsprotokoll zur Verfügung. Darüber hinaus stellen wir für ausgewählte Tabellen auch Ground Truth Daten für die Tabelleninhaltserkennung zur Verfügung, die von Mitgliedern der Community von Sozial- und Wirtschaftshistorikerinnen und –historikern geliefert werden.

“Why extracting data from PDFs is still a nightmare for data experts” by Benj Edwards

🔗 arstechnica.com/ai/2025/03/why

> Despite their promise, LLMs introduce several new problems to document processing. Among them, they can introduce confabulations or hallucinations (plausible-sounding but incorrect information), accidentally follow instructions in the text (thinking they are part of a user prompt), or just generally misinterpret the data.

#AI #OCR #LLM #PDF

⚓nicolas-hoizey.com/links/2025/

The workshop on Human-AI Collaboration for Handwritten Historical Sources just wrapped up at @freieuniversitaet 🔍📜

Fascinating discussions on #ocr with LLMs like LLaMA Vision-Instruct, #AI ’s role in historical research, challenges in working with handwritten documents, and a promising proof-of-concept prototype.

Thanks to the organizers, #aureka, @kaglinka and the Ada Lovelace Center for Digital Humanities, and to all participants for the inspiring exchange—looking forward to the next steps!

Jedes Mal, wenn ich bei der Arbeit in der Event-Kommunikation stecke, bekomme ich wieder selber Lust zu starten. Dann schweife ich ab und durchstöbere meine privaten Fotos von den Hunde-Events. Prokrastinieren kann ich. :D Ich bin noch unsicher, ob ich Gesicht zeigen möchte hier im Fediverse. Daher mache ich mich jetzt erstmal weiter unkenntlich, auch wenn's creepy aussieht und manchmal sehr schade um den Gesichtsausdruck ist. Gesichtsfasching kann nämlich nicht nur Ylvi.
:D

Foto: KaBo Photography & Art, aufgenommen bei Camp Canis Summer Special im Hoope Park 2024
Model: Ylvi und ich

Every time I'm involved in event communication at work, I get the urge to get to the starting line again myself. Then I drift off and browse through my private photos of the dog events. I can do procrastination. :D I'm still unsure whether I want to show my face here in Fediverse. That's why I'm continuing to make myself unrecognisable for now, even if it looks creepy and sometimes it's a shame because of the facial expressions. It's not just Ylvi who can do funny faces.

Photo: KaBo Photography & Art, taken at Camp Canis Summer Special in Hoope Park 2024
Model: Ylvi and me

#dogs #dogsofpixelfed #dogsofmastodon #ocr #hindernislauf #canicross #sports #running #sup #balance #matschparty #schlammschlacht #europeansleddog #sleddogs #sleddogsports