Выставка

Не позволяйте Prepress Workflles замедлить вас! Наш - разработал эффективность инструментов почти в 10 раз

Sep 26, 2025 Оставить сообщение

Не позволяйте Prepress Workflles замедлить вас! Наш - разработал эффективность инструментов почти в 10 раз

 

Фон разработки: результат фактических потребностей в производстве
Предварительная обработка документов для цифровой печати занимает слишком много времени. После общения с операторами фронта были определены и подтверждены три основных требования.
(1) Число страниц документов.
(2) Автоматически обрабатывать нечетные документы страниц: для документов с нечетными страницами пустая страница должна быть равномерно добавлена ​​в конце, в то время как документы с даже страницами должны оставаться неизменными.
(3) Платежная проверка для текста перегиб: чтобы избежать ошибок печати, вызванных отсутствующими шрифтами, необходимо подтвердить, был ли текст в документе преобразован в кривые (то есть «перегиб»).
Благодаря исследованиям на Adobe Acrobat и различных плагинах PDF -обработки на рынке, было обнаружено, что существующие инструменты либо имеют избыточные и сложные функции, либо не соответствуют фактическому производственному процессу компании, особенно с точки зрения рисков безопасности при преобразовании файлов. Что еще более важно, внутренние аналогичные инструменты часто требуют оплаты, что приводит к более высоким длительным - затратами на использование. Основываясь на вышеупомянутых практических проблемах, компания решила разработать легкий, точный и внутренне совместимый специализированный инструмент.
Инструмент проверки и обработки страниц PDF
01
Основные функции и логика суждения
Основной целью этого инструмента является обеспечение того, чтобы все страницы документа были напечатаны, и его подход суждения и исполнения заключается в следующем.
(1) Механизм обнаружения страниц: прочитайте метаданные документов PDF через библиотеку PymupDF, чтобы напрямую получить общую информацию о странице.
(2) Логика суждения паритета: используйте операцию модуля (номер страницы% 2), чтобы определить паритет. Если результат составляет 1, он оценивается как нечетная страница, и если результат равен 0, он считается равномерной страницей.
(3) Стратегия обработки дифференциации: если это нечетный пронумерованный документ, автоматически добавьте пустую страницу того же размера, что и исходный документ в конце документа; Если это ровный документ страницы, оставьте контент без изменений и скопируйте его непосредственно в выводный каталог.
(4) Принцип обработки безопасности: все обработанные документы сохраняются в обозначенном каталоге «обработанных файлов», и исходные файлы остаются неизменными, чтобы избежать повреждения файлов, вызванного неправильным операцией, как показано на рисунке 1.

 

info-1-1Рисунок 1 Интерфейс инструмента проверки и обработки PDF -страницы
02
Ключевые моменты технической реализации
Инструмент использует Tkinter для создания графического интерфейса, который в основном включает в себя три функциональных модуля.
(1) Модуль выбора каталогов: поддерживает визуальный выбор каталогов исходных файлов и выходных каталогов, причем каталог вывода по умолчанию является подпапником в рамках каталога Source.
(2) Модуль обработки пакетной обработки: Использование Multi - технологии потока для реализации обработки бэкэнд, избегая задержки интерфейса и отображения прогресса обработки в реальном - времени через строку прогресса.
(3) Модуль отображения результатов: представьте результаты обработки каждого файла в формате таблицы, включая исходный номер страницы, действия по обработке и информацию о состоянии, и различать успешные и неудачные состояния по цвету.
Инструмент проверки конверсии PDF
01
Основные функции и логика суждения
Инструмент проверки кривой фокусируется на определении того, был ли текст в документе преобразован в кривую, а его основная логика суждения основана на анализе информации о шрифтах в документах PDF.
(1) Обнаружение присутствия текста: с помощью функции извлечения текста страницы определите, содержит ли документ редактируемый текст.
(2) Анализ информации о шрифте: анализируйте список встроенных шрифтов в документе. Если есть информация о шрифте, это указывает на то, что текст не был преобразован.
(3) правило комплексного суждения: если есть текстовое содержание, но нет информации о шрифтах, это указывает на то, что песня была преобразована (помечена зеленым); Нет текстового содержимого, не указывая на необходимость переключать дорожки (зеленая метка); Если есть текстовое содержание и информацию о шрифте, это указывает на то, что песня не была преобразована (помечена красным), как показано на рисунке 2.
Инструмент специально разработан для режима «только проверка без преобразования», главным образом потому, что, согласно отзывам операторов, при выполнении операции преобразования в файлах, содержащих официальные печати, легко вызвать потерю официальных печатей и других шаблонов. Следовательно, только функция проверки сохраняется.

 

info-1-1Рисунок 2 Инструмент проверки конверсии PDF
02
Ключевые моменты технической реализации
Этот инструмент также использует Tkinter для создания интерфейса, а ключевые технические точки включают в себя следующие три пункта.
(1) Извлечение информации шрифта: Использование функции анализа текстового блока PymupDF, получение имен и вхождения всех шрифтов, используемых в документе.
(2) Визуализация результатов: используйте представление дерева, чтобы отобразить результаты проверки и визуально различать различные состояния с помощью цветов и значков.
(3) Функция статистики состояния: автоматически рассчитывать количество файлов, которые соответствуют требованиям, помогая операторам быстро понять общую ситуацию проверки.
Трудности и решения в процессе разработки
Как не профессиональный разработчик, я столкнулся с множеством технических проблем в процессе разработки инструментов. Конкретные проблемы и решения следующие.
(1) Проблема глубины анализа PDF: Используемая начальная библиотека PDF не смогла точно извлечь информацию о шрифтах. После рекомендации ИИ это было решено путем замены его библиотекой Pymupdf.
(2) Проблема задержки интерфейса: при обработке большого количества файлов оптом интерфейс подвержен невосприимчивому состояниям. С помощью руководства AI было реализовано многочисленное решение для обработки, чтобы эффективно решить эту проблему.
(3) Китайская отображая искаженные символы: настройка параметров шрифта и настройки кодирования, проблема искаженных символов китайского отображения в интерфейсе и экспортированных файлах была решена.
(4) Механизм обработки исключений: в ответ на проблему сбоев программ, вызванные поврежденными файлами PDF, был улучшен механизм захвата исключений, чтобы убедиться, что отказ отдельной обработки файлов не влияет на общий процесс.
На протяжении всего процесса разработки инструменты искусственного интеллекта играли важную роль в качестве технических консультантов, предоставляя не только примеры ключевого кода, но также объясняли принципы анализа формата файлов PDF, помогая разработчикам быстро понять профессиональные знания домены.
Ценность и перспектива приложения инструмента
Применение этих двух инструментов привело к значительному повышению эффективности производственной работы, которые отражаются в следующих двух аспектах.
(1) Экономия времени: работа по инспекции ручной работы, которая первоначально требовалась 1 час, теперь может быть завершена через 5 минут, повышая эффективность почти в 10 раз.
(2) Повышенная стабильность качества: эффективно избегание ручного осмотра упущений и обеспечение качества стабильной печати.
Запись процесса разработки этих двух небольших инструментов направлена ​​на то, чтобы передать философию работы «разведки и инновации», сосредоточиться на решении конкретных проблем в реальном производстве, оптимизации традиционных рабочих процессов с помощью технологических средств и в конечном итоге достичь цели снижения затрат и повышения эффективности.

 

Отправить запрос