MY.UAСтатьи
ИИ внесет данные быстрее и более точно, чем человек: как сервис Google помогает работать с документами
ИИ внесет данные быстрее и более точно, чем человек: как сервис Google помогает работать с документами

ИИ внесет данные быстрее и более точно, чем человек: как сервис Google помогает работать с документами

Если корпоративные данные в вашей компании неструктурированны, вы будете долго искать нужный файл на компьютере или документе среди сотен контрактов, счетов-фактур, паспортов и так далее. Не говоря уже о том, что, возможно, когда-нибудь придется весь этот объем данных анализировать. В части компаний, которые работают с персональными данными клиентов, сотрудники до сих пор вручную выписывают информацию из удостоверений личности и других документов. Если переложить заполнение этих форм на клиентов, неудобств становится еще больше.

Все эти проблемы объединяет одно: большинство компаний при работе с документами используют ручные, трудо- и ресурсоемкие процессы. Но люди могут ошибаться, работать так сложнее, а качество обслуживания падает.

Чтобы помочь бизнесу оптимизировать эти процессы, в 2020 году в Google запустили Document AI – искусственный интеллект, который позволяет организациям применять машинное обучение (ML) для решения проблем автоматизации сканирования документов.

Команда Wise IT в партнерском материале рассказывает больше об этом инструменте: для кого он станет полезным, какие у него возможности и как им пользоваться.

Где применяют Document AI

Работа с документами – неотъемлемая повседневность любого бизнеса. Сложно найти сферу, где Document AI не пригодится. Вот несколько примеров применения этой технологии:

  • Банковский сектор. Банки могут использовать технологию распознавания документов, чтобы автоматически обрабатывать данные, связанные с клиентскими счетами, кредитными картами, паспортами, в том числе с фотографиями, и так далее. Это уменьшает время, необходимое для обработки документов, а риск ошибиться при этом меньше.
  • Медицинские учреждения. Автоматическое сканирование документов поможет обрабатывать медицинские записи, листки направлений к врачам, результаты тестов и другие документы.
  • Бизнес-сектор. Компании могут использовать Document AI, чтобы автоматически обрабатывать и сортировать документы, связанные с финансовой отчетностью, контрактами, документами об уплате налогов и так далее.
  • Государственные учреждения. Правительственные структуры могут автоматически обрабатывать документы, связанные с обращениями граждан, налоговой отчетностью, лицензированием и тому подобным.
  • Гостиничный бизнес. С помощью автоматического сканирования документов можно ускорить регистрацию гостей.
  • Пограничные службы. Через контрольно-пропускные пункты проходят большие потоки людей. Если данные по их паспортам вносить автоматически, можно избежать длинных очередей и задержек.

Компания Google уже разработала специализированные модели для использования в определенных отраслях, например, обработка ипотечных кредитов и закупки. Но с помощью инструментов обучение моделей любая организация может настроить Document AI под свои нужды.

У Wise IT уже есть опыт внедрения Document AI среди компаний финансового сектора. В ряде пилотных проектов мы автоматизировали процесс верификации. Также мы настроили процессы распознавания новых документов и текущего архива – в нем было более миллиона документов. Это помогло ускорить поиск и процесс структурирования данных более чем на 50%.

Document AI и ряд других сервисов Google Cloud предоставляют неограниченные возможности для решения любых задач по распознаванию документов, причем можно использовать как уже настроенные модели, так и создавать кастомные клиентские шаблоны.

 

Из чего состоит Document AI

Основными инструментами Document AI являются Document AI Workbench и Document AI Warehouse – средства обучения моделей искусственного интеллекта, хранения документов и работы с ними.

Составные части Document AI

Как обрабатывать документы из Document AI Workbench

С помощью Document AI Workbench организации могут обрабатывать документы создавать собственные модели машинного обучения, которые отвечают их бизнес-потребностям, и получать структурированные данные с высоким уровнем точности. С удобным интерфейсом даже бизнес-пользователи, не очень знакомые с машинным обучением, могут «научить» модель.

Более того, если организация хочет передать знания из заранее обученных моделей и улучшить их, скажем, чтобы включить новые поля, теперь можно сделать это с помощью «обучения». Функция повышения квалификации модели особенно полезна для распространенных, но сложных вариантов использования. Так вам не придется начинать все сначала, вы сэкономите время и ресурсы.

К примеру, компания Libeo использовала Document AI, чтобы повысить точность анализатора счетов с 75,6% до 83,9%.

«Благодаря обучению модели результаты Document AI теперь превосходят результаты конкурентов и позволяют Libeo сэкономить около 20% от общих затрат на обучение моделей в долгосрочной перспективе», – рассказал технический директор Libeo Пьер-Антуан Гландье.

На конференции Next’22 Google объявил о новых возможностях проверки удостоверений личности с помощью гибкого API. С его помощью можно обнаруживать измененные или поддельные документы, удостоверяющие личность.

 

Как хранить документы и управлять ими с Document AI Warehouse

Инструмент Document AI Warehouse позволяет предприятиям искать, хранить, контролировать документы и управлять ими, а также их данными и метаданными, извлеченными с помощью ИИ, на единой платформе. Благодаря простому и интуитивно понятному веб-интерфейсу Document AI Warehouse пользователи могут просматривать, редактировать, массово обновлять и упорядочивать документы из папок.

А инструменты безопасности помогут контролировать, кто имеет доступ на уровне документов и папок, а также назначать пользователям и группам разрешения на просмотр, редактирование, управление, совместное использование и удаление документов. Можно переносить, синхронизировать или объединять документы из других хранилищ, таких как Microsoft SharePoint, Amazon S3 и IBM FileNet. Или, если это невозможно, Google просто индексирует контент и любые удаленные/отмеченные метаданные.

 

А что «под капотом»?

Кроме передовых разработок в области машинного обучения Google использует технологию оптического распознавания символов, или OCR. Это технология преобразования изображений текста в компьютерный текст, который можно индексировать, искать и редактировать. При работе над ней команды инженеров Google использовали подход, ориентированный на широкий языковой охват. Так они смогли разработать архитектуру, которая потенциально может работать со всеми языками и системами письма.

Google использует скрытые марковские модели (HMM), чтобы понимать входящие данные как целую последовательность, а не пытаться сперва разбить ее на части. Это похоже на то, как современные системы распознавания речи распознают аудиовход.

Эта технология доступна каждому в Google Workspace. Google добавил OCR в Google Drive и адаптировал его для поддержки всех основных языков мира – их более двухсот. Чтобы воспользоваться данной технологией, достаточно открыть на «Google Диске» отсканированный документ как документ Google. В результате откроется файл с оцифрованным текстом изображения.

Вам даже не нужно указывать, на каком языке написан документ, система определит это автоматически. Но вы также можете использовать API «Google Диска» для более явного контроля над определением языка в документах.


У Wise IT как Google Premier Partner есть команда высококвалифицированных специалистов, которые способны выполнить любую задачу, связанную с решениями Google Cloud и Google Workspace. Если вашему бизнесу нужно автоматизировать работу с документами или вы заинтересованы в других инструментах, разработанных калифорнийским техногигантом, обращайтесь за бесплатной консультацией по телефону +380442772323 или по адресу [email protected].

Поделиться
Поделиться сюжетом
Источник материала
В Париже картину синего цвета продали за 18,4 миллионов евро
Gloss
2025-10-27T15:39:33Z
Самые смешные фото животных в этом году: объявлены финалисты Comedy Wildlife Photography Awards 2025
Gloss
2025-10-27T15:06:35Z
Бренд SKIMS Ким Кардашьян выпустили нижнее белье с имитацией волос разных оттенков
Gloss
2025-10-15T10:30:37Z
Adidas представил коллекцию брендовой одежды для домашних животных
Gloss
2025-10-13T14:39:37Z
Названы лучшие астрономические фото 2025 года по версии Королевской обсерватории Гринвича
Gloss
2025-07-16T12:28:30Z
Ким Кардашьян и ее 69-летняя мама снялись в рекламе купальников SKIMS x Roberto Cavalli
Gloss
2025-06-30T14:45:43Z
Украинский трейлер фильма «День койота»
KinoFilms
2025-11-04T09:18:23Z
Украинский трейлер фильма «Последний викинг» с Мадсом Миккельсеном
KinoFilms
2025-10-31T09:54:24Z
Вышел анимационный трейлер к сценарию будущей полнометражной игровой ленты «Хорт. Первый характерник» по мотивам книги Ольги Навроцкой
KinoFilms
2025-10-27T16:24:21Z
Украинский трейлер фильма ужасов «Старая с..ка»
KinoFilms
2025-10-27T15:45:26Z
Украинский трейлер триллера «Помогите» с Рэйчел МакАдамс
KinoFilms
2025-10-17T18:51:28Z
Украинский трейлер фильма «Гренландия 2: Миграция» с Джерардом Батлером
KinoFilms
2025-10-17T18:27:21Z
Финальный тизер-трейлер фильма «Океан Ельзи: Спостереження шторму»
KinoFilms
2025-10-17T18:03:23Z
Украинский трейлер мультфильма «Космическая принцесса-лесбиянка»
KinoFilms
2025-10-17T17:00:24Z
Лучшие сериалы года: триумфаторы премии Эмми-2025
Gloss
2025-09-15T17:27:39Z
В Египте открыли самый крупный археологический музей мира, который строился 20 лет
Gloss
2025-11-04T15:00:35Z
Польский альпинист совершил первый в мире лыжный спуск с Эвереста без кислорода
Gloss
2025-11-03T16:36:33Z
Празднование на природе: идеи для любого времени года
Gloss
2025-05-13T06:40:26Z
Вкусная и дешевая намазка к бутербродам на пасху. Не успевала подавать на стол
InfoHome
2025-04-09T16:54:38Z
5 альтернативных видов спорта
Men's Life
2025-03-31T07:33:45Z
16 удивительных мест, которые стоит увидеть своими глазами
Men's Life
2025-02-04T10:24:53Z
Тренировки со скакалкой
Men's Life
2025-11-05T09:21:46Z
Как бросать кости в кости: Лучшие техники бросания
Cineast
2025-11-03T16:03:39Z
Умеет мыть посуду и убирать: в США стартовали продажи домашнего робота NEO
Gloss
2025-10-31T13:00:46Z
Nike представила кроссовки Mind, которые стимулируют работу мозга
Gloss
2025-10-28T17:18:38Z
Meet the artist using immersive technologies to transform the boundaries of performance and art
Elle
2025-10-23T14:06:30Z
10 лучших iGaming B2B-компаний в 2025 году
Cineast
2025-10-06T11:24:33Z
Медиабаинг в iGaming: Тенденции и прогнозы на 2025 год
Cineast
2025-10-06T11:12:36Z
Зерносушилки KMZ Industries: особенности и преимущества
Cineast
2025-09-26T16:06:42Z
HBO Max выходит на рынок Украины: сколько будет стоить подписка на стриминговый сервис
Gloss
2025-09-23T12:30:35Z
Как выбрать фрезер для маникюра и педикюра?
Gloss
2025-09-23T07:18:29Z
Не отличить от мясных: Если рыбные котлеты то только так
InfoHome
2025-05-09T13:09:51Z
Очень вкусный завтрак! Так яйца вы ещё не готовили. Простой и быстрый рецепт на завтрак. Рекомендую!
InfoHome
2025-05-09T13:09:51Z
Мы съели сердечки быстрее, чем шашлык! Вот это да
InfoHome
2025-05-06T10:45:45Z
Самые вкусные сырники из творога без муки, манки, крахмала
InfoHome
2025-05-03T06:57:59Z
Эти фрикадельки тают во рту! Лучший рецепт Фрикаделек с овсяной кашей в мультиварке
InfoHome
2025-05-03T06:55:06Z
Невероятно вкусный ужин для всей семьи. Так готовлю макароны 3 раза в неделю! Очень вкусно и быстро!
InfoHome
2025-05-03T06:55:05Z
Куриные крылышки на сковороде без фритюра за 30 минут
InfoHome
2025-05-02T06:42:59Z
Пирог Яблочный взрыв вкуснее торта, еще один быстрый рецепт вам в копилочку
InfoHome
2025-05-02T06:42:58Z
Капуста с яйцами вкуснее мяса! Я готовлю так капусту каждую неделю! Простой и вкусный рецепт капусты
InfoHome
2025-05-02T06:42:58Z