Подготовка. Медицинские исследования и все пути и сложности, связанные с этими исследованиями, как правило, представляют собой целую паутину знаний, которую можно легко пересечь, на которую можно сделать неправильную ссылку или даже сплагиатить (преднамеренно или непреднамеренно). Однако есть способы упростить этот процесс, особенно при работе с несколькими авторами и/или учреждениями в географически разбросанных регионах. В частности, инструмент, который позволяет исследователям искать определенные слова и/или фразы в документе или наборе документов, а затем автоматически выделять эти слова или фразы, чтобы документы можно было просматривать и обновлять.

Почему это важно? Потому что для большинства крупных исследовательских проектов есть множество докторов наук, докторов наук. кандидатов и научных сотрудников, работающих на различных этапах проекта. Многие могут знать или не знать количество людей, вовлеченных в проект. Часто несколько групп намеренно проводят аналогичные или даже идентичные исследования, чтобы создать исходные данные или обнаружить отклонения в текущих параметрах статус-кво процессов или исследований. Со всеми этими движущимися частями исследователям и их командам может быть сложно гарантировать актуальность своих результатов и уникально сообщать о них, чтобы избежать плагиата любых других исследований в их нише.

Для этого необходимо провести исследование уникального проекта (текущего), а также исследование аналогичных существующих проектов и публикаций. Когда те, кто управляет этими лабораториями, начинают думать о публикации, последнее становится особенно важным, поскольку им нужно будет ссылаться на любые существующие исследования или публикации, которые могли быть использованы, либо через протоколы исследований, либо через прямые цитаты из существующих проектов.

Конечно, с помощью инструментов обработки текстов можно найти язык в таких документах, как Microsoft Word или OpenOffice. Однако многие, если не все, текущие публикации, хранящиеся в NIH (Национальных институтах здравоохранения) и других местах, обычно хранятся в формате PDF из-за защищенного характера документации. Это представляет некоторую проблему, особенно для технической группы, которой поручено создание этого инструмента.

Сценарий использования. Ваша команда была выбрана для помощи группе исследователей в оптимизации их процессов. Они попросили вас создать инструмент, который может загружать несколько PDF-файлов и находить текст или фразы в этих файлах, которые исследователи вводят в специальном порядке. Затем эти слова и/или фразы должны быть выделены во всех документах цветом, определенным командой, чтобы привлечь внимание к этим областям документа для дальнейшего изучения.

Предлагаемое решение. Изучив все их потребности, вы предложили двусторонний подход, который поможет им достичь своих целей. Во-первых, используя C# .NET и GrapeCity GcPdf API, вы создадите приложение .NET 7, которое позволит исследователям легко выполнять поиск в любом документе PDF, выделять условия поиска и сохранять только что выделенный документ. Вторая часть решения заключается в предоставлении веб-приложения для чтения PDF-файлов на основе JavaScript, которое позволяет пользователям выделять слова в документах PDF.

Выделение слов в PDF-документах с помощью PDF API

API GrapeCity Documents for PDF (GcPdf) поддерживает поиск вхождений слова в PDF-документе и выделение их с помощью TextMarkupAnnotation. Аннотация помогает добавлять выделение, подчеркивание, зачеркивание или зубчатое (волнистое) подчеркивание к словам с помощью перечисления TextMarkupType.

Используйте следующий код, чтобы выделить слово определенным цветом с помощью GcPdf API:

// Find all occurrences of the word "childbirths":
var found = doc.FindText(new FindTextParams("childbirths", true, false), null);
 
// Add a text markup annotation to highlight each occurrence:
foreach (var f in found)
{
        var markup = new TextMarkupAnnotation()
        {
            Page = doc.Pages[f.PageIndex],
            MarkupType = TextMarkupType.Highlight,
            Color = Color.Yellow
        };
        foreach (var b in f.Bounds)
        markup.Area.Add(b);
}
// Done:
doc.Save(stream);

На приведенном выше снимке показано несколько вхождений слова «рождение ребенка», выделенного с помощью GcPdf API.

Выделение слов в PDF-документах с помощью PDF Viewer

Вы можете выделять, зачеркивать, подчеркивать текст или добавлять волнистую линию с новым набором аннотаций в GrapeCity Documents PDF Viewer (GcPdfViewer) на основе Javascript. Доступны следующие варианты:

  • Выделение, подчеркивание, волнистая линия и зачеркивание аннотаций на панели инструментов Инструменты быстрого редактирования и на панели инструментов Редактор аннотаций.

  • Контекстное меню разметки текста с новыми параметрами, видимыми при выделении текста. Параметры также доступны в контекстном меню по умолчанию.
  • Кнопки для добавления новых аннотаций на панель инструментов — «редактирование-выделение», «редактирование-подчеркивание», «редактирование-волнистость», «редактирование-зачеркивание».
  • Включите или отключите контекстное меню «Разметка текста».
  • Измените список цветов, доступных в контекстном меню, с помощью кода.

Чтобы выделить слова в PDF Viewer:

1. Настройте GcPdfViewer для параметров редактирования PDF, чтобы отобразить редактор аннотаций на панели инструментов и включить контекстное меню разметки текста. Меню отображается всякий раз, когда пользователь выбирает текст в документе PDF в GcPdfViewer. Контекстное меню доступно, только если настроены службы SupportAPI и включены функции редактирования средства просмотра.

2. Откройте нужный PDF-файл в средстве просмотра с помощью кнопки «Открыть» на панели инструментов.

3. На главной панели инструментов выберите «Текстовые инструменты». Выберите нужную текстовую аннотацию на дополнительной панели инструментов и примените ее к тексту или области.

4. Начните редактирование, добавив аннотации Выделить, Подчеркнуть, Волнистую линию и Зачеркнуть в нужных местах PDF-файла. Вы также можете выделить текст, и появится контекстное меню Text Markup. Выберите в меню нужную аннотацию текстовой разметки.

5. Либо нажмите «Редактор аннотаций» на левой боковой панели.

6. Параметры аннотаций Выделить, Подчеркнуть, Волнистые и Зачеркнуть будут доступны на главной панели инструментов.

7. После добавления аннотаций сохраните PDF-файл. Сохраненный PDF-файл будет отражать недавно добавленные аннотации.

Ознакомьтесь — Как комментировать и отвечать в документах PDF

Использованная литература:

Что вы думаете о функциях разметки текста в GcPdf, GcPdfViewer? Пожалуйста, оставьте комментарий ниже.

Первоначально опубликовано на https://www.grapecity.com 17 мая 2023 г.