Для тех, кто считает лишнюю работу болезненной и ценит автоматизацию.
Я влюбился в Google Natural Language API, и вам он тоже понравится! Опыт программирования не требуется!
У вас есть несколько документов, которые необходимо объединить в один основной документ на основе пересекающихся тем?
Позволь мне привести пример. На моей текущей работе большинству новых сотрудников предоставляется обширный документ Google по адаптации со всей информацией, необходимой им для достижения успеха в команде. Документ включает в себя бизнес-контекст, офисную информацию, памятку о культуре, лучшие практики разнообразия и интеграции, информационные панели, активы бренда, ресурсы поддержки, продукты питания, список для чтения, инструменты и ресурсы, быстрые ссылки, резервные каналы, списки рассылки и, конечно же, команду. -конкретная информация.
Около 60% контекста составляла «общая» информация, применимая ко всем сотрудникам. Тем не менее, информация сохранялась отдельными командами в их индивидуальных документах. Если на обслуживание этой избыточной информации для 100 команд уходило десять минут в месяц, то это 16 часов в месяц или 192 часа в год впустую.
СОВЕТ. Консолидация заключается в идентификации, централизации и указании.
Легкие победы
Очевидным и легким выигрышем будет:
- Определите, какая информация была избыточной во всех документах по адаптации.
- Централизировать местонахождение основного контента, например размещения на веб-сайте.
- Укажитедокумент на сайт и получите только информацию о рабочей группе в установочном документе.
Не все, достаточно
Чтобы добиться успеха, вам не нужен КАЖДЫЙ адаптационный документ от каждой команды. Было бы проще, если бы у вас была выборка по всей компании для выявления закономерностей. Для документов о приеме на работу полезно сосредоточиться на персоне сотрудника, например, на всех «инженерах» в вашей компании. Я определил около 100 команд и собрал около 30 документов по адаптации для выборки в 30%.
Автоматизация? Да, пожалуйста!
Я мог бы вручную просмотреть каждый документ, определить пересекающиеся разделы и извлечь ссылки, но я разработчик, поэтому мне приходится все автоматизировать. Именно здесь обработка естественного языка (NLP) спасает положение. С помощью НЛП можно написать сценарий, который будет разбирать и анализировать документ. NLP обычно используется для чат-ботов, поисковых систем, инструментов для исправления грамматики и мониторинга социальных сетей. У Google есть API под названием Natural Language Cloud API, который мы можем использовать для обработки документа Google. Вот несколько вещей, которые вернет API:
- Объект — это существительные (люди, места или вещи). Я использую их в качестве основных ключевых слов.
(Примеры: Bootcamp, Java, Information Security, AWS, Hackathon, Kubernetes) - Тип объекта — это категории ключевого слова
(примеры: люди, местоположение, организация, произведение искусства, событие, потребительский товар) - Заметность. Это оценка, и чем ближе вы к 1, тем больше Google уверен в том, что объект является основным объектом контента.
Это полезно, если вы пытаетесь быстро обобщить документ. - Количество упоминаний. Чем больше упоминаний, тем выше вероятность того, что мы нашли контент, который можно разместить на централизованном веб-сайте.
Если вы не разработчик
Я хотел сделать это настолько простым, чтобы это мог сделать любой человек с нулевым опытом программирования. Я создал простое пошаговое обучающее видео за символическую плату. После создания таблицы Google у вас есть идеальная отправная точка для определения того, какой контент вы хотите разместить в централизованном месте.
Если вы разработчик
Для тех из вас, кто является разработчиком, у вас не должно возникнуть проблем с выполнением шагов.
- Google Cloud API
Создайте учетную запись Google Cloud Platform, включите выставление счетов, включите Cloud Natural Language API и в разделе Создать учетные данные вы можете создать ключ API. - Сценарий приложения Google
В своем документе Google перейдите в раздел: Инструменты-›Редактор сценариев и вставьте код из github. Замените значение ключа API своим ключом API. - Запустите функцию «Основной»
Он запросит авторизацию на вашем диске Google, чтобы создать новый лист Google под названием: NLP_Results_(timestamp)