На этой неделе я пытался выбрать между использованием существующего набора данных для ответов на вопросы для финансовых документов и созданием нового набора данных.

Я собрал некоторые плюсы и минусы и определил потенциальные наборы данных. Создание нового набора данных с нуля требует усилий. Но он также может быть основой для публикации. Кроме того, похоже, не существует набора данных, соответствующего моему исследовательскому вопросу.

Мой руководитель и я обсудим результаты и примем решение на следующей неделе.

Вы можете следить за обновлениями: Substack Blog Telegram WhatsApp LinkedIn Medium Twitter Calendly

Что произошло с прошлой недели?

Я закончил вторую половину книги Роберта Дэя Как написать и опубликовать научную статью. Хорошая книга.

Мой руководитель предложил набор данных, который я мог бы использовать для сравнительного анализа моих алгоритмов. Если этот набор данных подходит для моего исследования, это может сэкономить мне много времени, так как мне не придется создавать набор данных самостоятельно. Я размышлял над этим набором данных и не уверен, подходит ли он мне. Я обсужу это со своим руководителем во вторник.

Мой коллега Томас Хубер провел презентацию на Кафедре наук о данных и НЛП об интроспекции языковых моделей на основе трансформеров [LM-Debugger — An Interactive Tool for Inspection and Intervention in Transformer-Based Language Models (Geva et al. др., 2022)]. В статье представлен метод точного изменения поведения языковых моделей для определенных подсказок (среди прочего исследовательского вклада).

Каковы были самые большие препятствия?

Никаких серьезных препятствий. Сегодня я снова оставил телефон дома, и это было здорово.

Какие цели я достиг?

  1. Напишите один раздел для первой статьи. Первым документом будет обзор литературы/актуальные сведения.
  2. Определите конференцию для самых современных.

Какие голы я пропустил?

  1. Согласовать розетку (конференцию) с моим супервайзером. (То есть спросить его, нравится ли ему конференция и думает ли она, что она соответствует моему исследовательскому вопросу.

Это была хорошая неделя?

Да. Все становится на свои места, и у меня появляется более четкое представление о литературе и о том, о чем я хочу писать.

Краткосрочные задачи на ближайшую неделю

  1. Согласовать розетку (конференцию) с моим супервайзером. (То есть спросить его, нравится ли ему конференция и думает ли она, что она соответствует моему исследовательскому вопросу.
  2. Решите, готовить ли набор данных самостоятельно или взять уже существующий набор данных.

О книге «75 шагов к докторской степени. в обработке естественного языка»

Отныне ты будешь свидетелем моей работы. Почувствуй мою кровь, пот и слезы.

С этой серией статей вы станете еженедельным свидетелем того, как продвигается моя диссертация, всего за 75 шагов. Это имеет несколько целей:

1) Заставлять себя двигаться через силу публичного позора!

2) Помощь другим (потенциальным) кандидатам наук. чтобы студенты оставались мотивированными и показывали, что трудные времена — это нормально, когда они проходят через этот процесс.

3) Получение поддержки от сообщества, когда я переживаю трудные времена.

Поделитесь этим со своим кандидатом наук. студенческие друзья: Substack Блог Telegram WhatsApp LinkedIn Medium Twitter Calendly.

Подробнее из 75 шагов к докторской степени. в серии НЛП

2022–08–20: Обновление 1/75 — Начало пути к докторской степени. в НЛП

2022–08–28: Обновление 2/75 — Обзор литературы

2022–09–04: Обновление 3/75 — Назад в курс дела и обратно в Валлендар

2022–09–10: Обновление 4/75 — Длительное время выполнения теста; Ретривер работает

2022–09–18: Обновление 5/75 — Jour Fixe Joy

2022–09–26: Обновление 6/75 — Группа чтения

2022–10–02: Обновление 7/75 — Оставить телефон дома

2022–10–09: Обновление 8/75 — Поиск конференции

2022–10–16: обновление 9/75 — набор данных — сделай или возьми