1. GAASP: Протокол атомистической выборки материалов с высокой энтропией на основе генетического алгоритма (arXiv)

Автор: Г. Ананд

Аннотация: Материалы с высокой энтропией состоят из нескольких элементов на сравнительно более простых решетках. Из-за многокомпонентной природы таких материалов выборка в атомном масштабе требует больших вычислительных затрат из-за комбинаторной сложности. Мы предлагаем методологию, основанную на генетическом алгоритме, для отбора проб таких сложных химически неупорядоченных материалов. Варианты протокола атомистической выборки на основе генетического алгоритма (GAASP) могут генерировать структуры с низкой и высокой энергией. Низкоэнергетический вариант GAASP в сопряжении с критериями мегаполиса позволяет избежать преждевременной конвергенции, а также обеспечивает условие детального баланса. GAASP можно использовать для создания низкоэнергетических структур для термодинамических прогнозов, а также для создания различных структур для приложений машинного обучения.

2. Клиническая оптимизация гиперпараметров BioBERT с использованием генетического алгоритма (arXiv)

Автор: Навья Мартин Коллапалли, Джеймс Геллер.

Резюме: Клинические факторы составляют лишь небольшую часть, около 10–30%, контролируемых факторов, влияющих на результаты здоровья человека. Остальные факторы включают в себя место, где человек родился и вырос, где он/она получил образование, каково его рабочее и семейное окружение и т. д. Все вместе эти факторы называются социальными детерминантами здоровья (SDoH). Большая часть данных SDoH записывается врачами и практикующими врачами в неструктурированных клинических заметках. Запись данных SDoH в структурированном виде (в EHR) могла бы значительно выиграть от специальной онтологии терминов SDoH. Наше исследование сосредоточено на извлечении предложений из клинических записей с использованием такой онтологии SDoH (называемой SOHO) для предоставления соответствующих концепций. Мы используем последние достижения в области глубокого обучения для оптимизации гиперпараметров модели Clinical BioBERT для текста SDoH. Для определения оптимальных настроек параметров был реализован режим настройки гиперпараметров на основе генетического алгоритма. Чтобы реализовать полный классификатор, мы создали конвейер Clinical BioBERT с двумя последовательными линейными слоями и двумя слоями исключения. Выходные данные предсказывают, описывает ли текстовый фрагмент проблему SDoH пациента. Мы сравнили оптимизаторы AdamW, Adafactor и LAMB. В наших экспериментах AdamW превзошел остальные по точности.