🗊 Презентация Система оптического распознавания документа

Категория: Образование
Нажмите для полного просмотра!
Система оптического распознавания документа, слайд №1 Система оптического распознавания документа, слайд №2 Система оптического распознавания документа, слайд №3 Система оптического распознавания документа, слайд №4 Система оптического распознавания документа, слайд №5 Система оптического распознавания документа, слайд №6 Система оптического распознавания документа, слайд №7 Система оптического распознавания документа, слайд №8 Система оптического распознавания документа, слайд №9 Система оптического распознавания документа, слайд №10 Система оптического распознавания документа, слайд №11 Система оптического распознавания документа, слайд №12 Система оптического распознавания документа, слайд №13 Система оптического распознавания документа, слайд №14 Система оптического распознавания документа, слайд №15 Система оптического распознавания документа, слайд №16 Система оптического распознавания документа, слайд №17 Система оптического распознавания документа, слайд №18 Система оптического распознавания документа, слайд №19

Вы можете ознакомиться и скачать презентацию на тему Система оптического распознавания документа. Доклад-сообщение содержит 19 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1


Система оптического распознавания документа Модуль 2. Тема 5. Козлов А.В.
Описание слайда:
Система оптического распознавания документа Модуль 2. Тема 5. Козлов А.В.

Слайд 2


Назначение систем оптического распознования текста Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или...
Описание слайда:
Назначение систем оптического распознования текста Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе).

Слайд 3


Задача оптического распознования Перевод документов, научных публикаций, социальной информации, исторических изданий в электронный вид. Классификация...
Описание слайда:
Задача оптического распознования Перевод документов, научных публикаций, социальной информации, исторических изданий в электронный вид. Классификация документов. Накопление и хранение электронных документов.

Слайд 4


История 1929 году - Густав Таушек (Gustav Tauschek) получил патент на метод оптического распознавания текста в Германии; 1933 год - Гендель (Paul W....
Описание слайда:
История 1929 году - Густав Таушек (Gustav Tauschek) получил патент на метод оптического распознавания текста в Германии; 1933 год - Гендель (Paul W. Handel) получил патент на свой метод в США ; 1935 год – Г. Таушек также получил патент США на свой метод; 1950 год - Дэвид Х. Шепард (David H. Shepard) - построил машину, решающую задачу преобразования печатных сообщений в машинный язык для обработки компьютером. 1955 год - Первая коммерческая система была установлена на «Ридерс Дайджест» 1965 год - «Ридерс Дайджест» и «Ар-Си-Эй» начали сотрудничество с целью создать машину для чтения документов, использующую оптическое распознавание текста, предназначенную для оцифровки серийных номеров купонов «Ридерс Дайджест», вернувшихся из рекламных объявлений. 1965 год - Почтовая служба Соединённых Штатов для сортировки почты использует машины, работающие по принципу оптического распознавания текста, созданные на основе технологий, разработанных исследователем Яковом Рабиновым.

Слайд 5


История 1971 год - Почта Канады использует системы оптического распознавания символов 1974 год - Рэй Курцвейл создал компанию «Курцвейл Компьютер...
Описание слайда:
История 1971 год - Почта Канады использует системы оптического распознавания символов 1974 год - Рэй Курцвейл создал компанию «Курцвейл Компьютер Продактс», и начал работать над развитием первой системы оптического распознавания символов, способной распознать текст, напечатанный любым шрифтом. 1978 год - Компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов. 1992 год – Начало продажи первой коммерчески успешной программой, распознающей кириллицу, «AutoR» российской компании «ОКРУС» (ОС DOS). Конец 60-х годов – разработка и испытание шрифтонезависимого алгоритма распознования текста выпускниками МФТИ, биофизиками: Г. М. Зенкиным и А. П. Петровым

Слайд 6


Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный...
Описание слайда:
Системы оптического распознавания символов При coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов. Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. (Википедия) С помощью сканера несложно получить изображение cтpaницы текста в графическом файле.

Слайд 7


Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Далее выделенные текстовые...
Описание слайда:
Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и т. д. Далее выделенные текстовые фрагменты графического изображения страницы необходимо преобразовать в текст.

Слайд 8


Хорошее качество текста Растровый метод распознавания текста Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие...
Описание слайда:
Хорошее качество текста Растровый метод распознавания текста Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном. Сначала растровое изображение страницы разделяется на изображения отдельных символов. Затем каждый из них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.

Слайд 9


Плохое качество текста Структурный метод распознавания При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.)...
Описание слайда:
Плохое качество текста Структурный метод распознавания При распознавании документов с низким качеством печати (машинописный текст, факс и т. д.) используется метод распознавания символов по наличию в них определенных структурных элементов (отрезков, колец, дуг и др.). Любой символ можно описать через набор параметров, определяющих взаимное расположение eгo элементов. Например, буква «Н» и буква «И» состоят из трех отрезков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между буквами в величине улов, которые составляет третий отрезок с двумя другими. При pacпознавании структурным методом в искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов. В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего coответствуют распознаваемому символу.

Слайд 10


Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical...
Описание слайда:
Программы распознавания текста Преобразованием графического изображения в текст занимаются специальные программы распознавания текста (Optical Character Recognition - OCR). Современная OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами, но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст — это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата — скажем, формата Microsoft Word.

Слайд 11


Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый,...
Описание слайда:
Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают. Наиболее распространенные системы оптического распознавания символов, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так и структурный методы распознавания. Кроме того, эти системы являются «самообучающимися» (для каждого конкретного документа они создают соответствующий набор шаблонов символов) и поэтому скорость и качество распознавания многостраничного документа постепенно возрастают. Существует также системы On-line распознавания текста: Online OCR и ABBYY FineReader Online ( ,

Слайд 12


Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются...
Описание слайда:
Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных. Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст. Системы распознавания рукописного текста. С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Слайд 13


OCR-приложения Это приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition - Оптическое...
Описание слайда:
OCR-приложения Это приложения, которые производят сканирование и распознавание текста, от англ. Optical Character Recognition - Оптическое распознавание символов Это программы для перевода изображений документов в редактируемый текст, который можно затем обрабатывать в текстовых и табличных редакторах. По сравнению с ручной перепечаткой текста, такие программы дают существенный выигрыш в скорости работы, к тому же делают меньше ошибок. Еще одно достоинство - возможность сохранить иллюстрации, а они иногда не менее важны, чем текст документа.

Слайд 14


OCR CUNEIFORM Это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies. OCR CuneiForm...
Описание слайда:
OCR CUNEIFORM Это бесплатная программа сканирования и распознавания текста российского разработчика Cognitive Technologies. OCR CuneiForm обеспечивает быстрое, удобное и качественное распознавание текста с сохранением исходного вида документа. Поддерживается распознавание с более 20 языков, среди них русский, украинский, английский, немецкий, французский, испанский, итальянский, португальский, шведский, финский, сербский, хорватский, польский, а также распознавание смешанного русско-английского текста.

Слайд 15


ABBYY FineReader Популярная программа распознавания текста российской компании ABBYY Программа производит распознавание текста с более 180 языков,...
Описание слайда:
ABBYY FineReader Популярная программа распознавания текста российской компании ABBYY Программа производит распознавание текста с более 180 языков, для 38 из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг. Стоимость программы 3990 рублей

Слайд 16


OmniPage Популярная программа распознавания текста российской компании ABBYY Программа отличается высокой скоростью и точностью распознавания....
Описание слайда:
OmniPage Популярная программа распознавания текста российской компании ABBYY Программа отличается высокой скоростью и точностью распознавания. Распознаются более 120 языков с различными алфавитами: латинский, греческий алфавиты, кириллица, китайский, японский и корейский языки. Как и FineReader, OmniPage уверенно распознает документы, полученные с помощью цифровых камер с помощью технологии коррекции изображения "3D Correction". Стоимость программы 6090 рублей (150 евро)

Слайд 17


Readiris Программа сканирования и распознавания текста компании I.R.I.S. Поддерживается распознавание текста с более 120 языков распознавания,...
Описание слайда:
Readiris Программа сканирования и распознавания текста компании I.R.I.S. Поддерживается распознавание текста с более 120 языков распознавания, включая русский, а также ближневосточные языки - арабский, иврит, фарси (в версии Middle-East) и японский, китайский, корейский (в версии Asian). Есть версия Readiris для Macintosh. Вместе с поддержкой распознавания популярных форматов картинок, распознаются файлы PDF и DjVu. Стоимость программы 3845-14875 рублей (129 $-499 $)

Слайд 18


Microsoft Office Document Imaging Программа распознавания текста компании Microsoft Программа Document Imaging способна работать только с двумя...
Описание слайда:
Microsoft Office Document Imaging Программа распознавания текста компании Microsoft Программа Document Imaging способна работать только с двумя языками: английским и языком локализации самого MS Office. Для поддержки других языков необходимо дополнительно устанавливать пакет Multilingual User Interface (MUI). OCR настроек в программе практически нет, программа в автоматическом режиме поддерживает распознавание типа и размера шрифтов, картинок и простых таблиц. Стоимость программы входит в стоимость пакета MS Office.

Слайд 19


Источники литературы: 1. Богданов В., Ахметов К. Системы распознавания текстов в офисе. // Компьютер-пресс — 1999 №3, с.40-42. 2. Павлидис Т....
Описание слайда:
Источники литературы: 1. Богданов В., Ахметов К. Системы распознавания текстов в офисе. // Компьютер-пресс — 1999 №3, с.40-42. 2. Павлидис Т. Алгоритмы машинной графики и обработки изображений. М:, Радио и связь, 1986 3. Shani U. Filling Regions in Binary Raster Images — a Graph-theoretic Approach. // SIGGRAPH'80, pp 321-327. 4. Merrill R.D. Representation of Contours and Regions for Efficient Computer Search. // CACM, 16 (1973), pp. 69-82. 5. Pavlidis T. Filling Algorithms for Raster Graphics. // CGIP, 10 (1979), pp. 126141. 6. 7 .



Похожие презентации
Mypresentation.ru
Загрузить презентацию