Застосування методів штучного інтелекту з дослідження ліків для LLM для зменшення галюцинацій

05.12.2024

Революційні проєкти GitHub: Автоматичне дослідження ліків за допомогою ШІ

Інтеграція штучного інтелекту (ШІ) в дослідження ліків революціонізує фармацевтичну галузь. Відіграють вирішальну роль відкриті джерела проєктів на GitHub. У цьому документі ми представляємо деякі з найінноваційніших проєктів, які просувають автоматичне дослідження ліків за допомогою ШІ.

DeepChem: Відкрита платформа для глибокого навчання в хімії

DeepChem - це провідна відкрита бібліотека, яка робить глибоке навчання доступним для хімічних застосувань. Вона надає інструменти для:

Advertising

Моделювання молекул
Прогнозування структури білків
Матеріалознавства

Завдяки зручному інтерфейсу DeepChem дозволяє дослідникам реалізовувати складні моделі ШІ без глибоких знань програмування. Це прискорює відкриття нових ліків і сприяє інноваціям у галузі.

MoleculeNet: Бенчмаркінг для ШІ в хімії

MoleculeNet - це всеосяжна система бенчмаркінгу, розроблена спеціально для машинного навчання в хімічному дослідженні. Вона надає:

Стандартизовані набори даних
Метрики оцінки
Порівняння продуктивності моделей

Забезпечуючи єдині бенчмарки, MoleculeNet полегшує порівняння різних моделей ШІ і сприяє прогресу у відкритті ліків.

ATOM Modeling PipeLine (AMPL): Прискорене відкриття лікарських засобів

ATOM Modeling PipeLine - це проєкт консорціуму ATOM, який має на меті пришвидшити розробку ліків за допомогою машинного навчання. AMPL надає:

Модульну трубопровід для обробки даних
Автоматичне навчання моделі
Розширені фреймворки для різних сценаріїв використання

За допомогою AMPL дослідники можуть ефективно створювати складні моделі, що скорочує час від відкриття до впровадження нових ліків на ринок.

Chemprop: Прогнозування молекулярних властивостей за допомогою глибокого навчання

Chemprop використовує графічні нейронні мережі для прогнозування молекулярних властивостей. Його особливості включають:

Висока точність прогнозування
Налаштовувані архітектури моделей
Підтримка різних хімічних наборів даних

Chemprop досягає видатних результатів у кількох змаганнях і є цінним інструментом для ШІ-підтримуваної хімії.

DeepPurpose: Універсальний інструментарій для відкриття лікарських засобів

DeepPurpose - це всеосяжний інструментарій глибокого навчання для досліджень ліків. Він надає:

Інтеграцію різних моделей і наборів даних
Просте впровадження моделей прогнозування
Застосування в взаємодіянні білок-ліганд

Завдяки своїй універсальності DeepPurpose дозволяє дослідникам швидко та ефективно ідентифікувати нових терапевтичних кандидатів.

OpenChem: Спеціалізований фреймворк глибокого навчання для хімічних застосувань

OpenChem - це спеціалізований фреймворк глибокого навчання, розроблений для хімії. Він вирізняється тим, що:

Підтримка генерування молекул
Прогнозування властивостей
Гнучкість у дизайні моделі

OpenChem сприяє розвитку нових методів ШІ в хімії та сприяє прискоренню досліджень.

Відкрита спільнота GitHub сприяє просуванню меж автоматичного дослідження ліків. Завдяки поєднанню ШІ і хімії відкриваються нові можливості для більш ефективного та точного розробки терапевтичних рішень. Ці інновації мають потенціал змінити майбутнє медицини.

Застосування методів штучного інтелекту з дослідження ліків для дистиляції моделей ШІ

Методи штучного інтелекту, що використовуються в автоматичному дослідженні ліків, пропонують інноваційні підходи, які можна перенести на дистиляцію моделей ШІ. Хоча ці два поля здаються різними на перший погляд, вони мають спільні техніки та проблеми, що дозволяє їх ефективне застосування.

Обґрунтованість застосування

Застосування методів дослідження ліків для дистиляції моделей ШІ є обґрунтованим, оскільки:

Спільні методи: Обидва поля використовують просунуті техніки машинного навчання, такі як глибоке навчання, нейронні мережі та графічні моделі.
Зменшення складності: У дослідженні ліків складні молекулярні структури спрощуються, подібно до зменшення розміру великих моделей ШІ.
Оптимізація та ефективність: Як відкриття ліків, так і дистиляція моделей спрямовані на досягнення ефективних і продуктивних результатів з обмеженими ресурсами.

Як це можна зробити

1. Графічні нейронні мережі (GNN) для розуміння структури

У дослідженні ліків використовуються графічні нейронні мережі для аналізу складних молекулярних структур. Ці техніки можуть бути використані в дистиляції моделей, щоб зрозуміти структуру великих моделей і виділити важливі характеристики для меншої моделі.

2. Перенесення знань та вилучення ознак

Моделі з проєктів, таких як DeepChem або Chemprop, використовують перенесення знань для навчання на існуючих наборах даних. Подібно до цього можна використовувати в дистиляції, щоб використати велику попередньо навчену модель як відправну точку з вилучення ключових ознак для меншої моделі.

3. Навчання багатозадачі для моделей універсальності

Проєкти, такі як MoleculeNet, використовують навчання багатозадачі для навчання моделей, які можуть одночасно виконувати кілька завдань. Цей метод можна використовувати в дистиляції для створення компактних моделей, які все ще здатні виконувати різноманітні функції.

4. Методи оптимізації з дослідження ліків

Підходи до оптимізації, що використовуються в дослідженні ліків, наприклад, тонке налаштування гіперпараметрів або використання еволюційних алгоритмів, можуть бути застосовані для підвищення ефективності дистильованих моделей.

5. Збільшення та генерація даних

Генерація синтетичних даних є ключовою в проєктах, таких як DeepPurpose. Подібні техніки можна використовувати для покращення процесу навчання учбової моделі в дистиляції, особливо якщо обмежена кількість даних доступна.

Практичні кроки реалізації

Аналіз структури моделі: Використання GNN для ідентифікації ключових компонентів навчальної моделі.
Вилучення ознак: Виділення важливих ознак, які є вирішальними для продуктивності моделі.
Ефективний дизайн архітектури: Адаптація архітектур моделей з дослідження ліків до більш компактних структур.
Спільне навчання: Впровадження навчання багатозадачі для навчання учбової моделі на кількох завданнях та підвищення її узагальнювальної здатності.

Інтеграція методів, що використовуються в автоматичному дослідженні ліків, в дистиляцію моделей ШІ відкриває нові шляхи для підвищення ефективності та зменшення складності. Переносячи добре перевірені техніки, можна розробити потужні та компактні моделі, які відповідають вимогам сучасних застосувань ШІ. Цей міждисциплінарний підхід сприяє інноваціям і прискорює прогрес у обох сферах досліджень.

Додаткове роздумування: Чи має сенс?

Дослідження ліків та природна мова, хоч й різні, обидві використовують складні правила та структури. Методи моделювання та прогнозування в дослідженні ліків можуть дати цінний імпульс для обробки природної мови. Важливо бути відкритим до міждисциплінарних підходів, оскільки інновації часто виникають на перетинах різних галузей.

Інтеграція методів з автоматичного дослідження ліків в дистиляцію моделей ШІ може стати перспективним шляхом для підвищення точності та зменшення галюцинацій. Хоча деякі методи вже використовуються в моделях ШІ, є місце для подальших інновацій за допомогою міждисциплінарного підходу.

Реалізація для зменшення галюцинацій у моделях ШІ з використанням Hugging Face

У цьому документі ми показуємо, як створити мовну модель з оцінкою невизначеності за допомогою Hugging Face та Python, щоб зменшити галюцинації. Ми використовуємо техніки, натхненні методами в автоматичному дослідженні ліків, зокрема оцінку невизначеності через Monte Carlo Dropout.

Попередні умови

Python 3.6 або вище
Встановлені бібліотеки:
- transformers
- torch
- datasets

Ви можете встановити необхідні бібліотеки за допомогою наступної команди:

pip install transformers torch datasets

Код реалізації

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch.nn.functional as F
import numpy as np

# Завантаження токенізатора та моделі
model_name = 'gpt2'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Увімкнення Dropout під час оцінювання
def enable_dropout(model):
"""Увімкнення шарів Dropout у моделі під час оцінювання."""
for module in model.modules():
if isinstance(module, torch.nn.Dropout):
module.train()

# Функція для генерації з оцінкою невизначеності
def generate_with_uncertainty(model, tokenizer, prompt, num_samples=5, max_length=50):
model.eval()
enable_dropout(model)
inputs = tokenizer(prompt, return_tensors='pt')
input_ids = inputs['input_ids']

# Генерація кількох прикладів для оцінки невизначеності
outputs = []
for _ in range(num_samples):
with torch.no_grad():
output = model.generate(
input_ids=input_ids,
max_length=max_length,
do_sample=True,
top_k=50,
top_p=0.95
)
outputs.append(output)

# Декодування згенерованих послідовностей
sequences = [tokenizer.decode(output[0], skip_special_tokens=True) for output in outputs]

# Обчислення невизначеності (ентропія)
probs = []
for output in outputs:
with torch.no_grad():
logits = model(output)['logits']
prob = F.softmax(logits, dim=-1)
probs.append(prob.cpu().numpy())

# Обчислення середньої ентропії
entropies = []
for prob in probs:
entropy = -np.sum(prob * np.log(prob + 1e-8)) / prob.size
entropies.append(entropy)

avg_entropy = np.mean(entropies)
uncertainty = avg_entropy

# Вибір найбільш ймовірної послідовності
from collections import Counter
sequence_counts = Counter(sequences)
most_common_sequence = sequence_counts.most_common(1)[0][0]

return {
'generated_text': most_common_sequence,
'uncertainty': uncertainty
}

# Приклад використання
prompt = "Вплив штучного інтелекту на медицину є"
result = generate_with_uncertainty(model, tokenizer, prompt)
print("Згенерований текст:")
print(result['generated_text'])
print("Оцінені невизначеності:", result['uncertainty'])

Пояснення коду

Завантаження токенізатора та моделі: Ми використовуємо попередньо навчену модель GPT-2 з Hugging Face.

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

Увімкнення Dropout: За допомогою функції enable_dropout ми вмикаємо шари Dropout під час оцінювання, щоб реалізувати Monte Carlo Dropout.

def enable_dropout(model):
for module in model.modules():
if isinstance(module, torch.nn.Dropout):
module.train()

Генерація з оцінкою невизначеності: Функція generate_with_uncertainty генерує кілька прикладів та обчислює невизначеність, використовуючи ентропію розподілів вихідних даних.
```
def generate_with_uncertainty(model, tokenizer, prompt, num_samples=5, max_length=50):
# Функція реалізована як показано вище
```
Обчислення невизначеності: Ентропія розподілів ймовірностей обчислюється для оцінки невизначеності. Вища ентропія вказує на більшу невизначеність.
Вибір найкращої послідовності: Найбільш часто згенерована послідовність вибирається як остаточний результат.

Використання репозиторіїв GitHub

Для розширеної функціональності та передових методів можна використовувати такі репозиторії GitHub:

Bayesian Transformer Networks: Bayesian Transformers
- Реалізація трансформерів з байєсівськими методами для оцінки невизначеності.
Knowledge-Augmented Language Models: K-Adapter
- Підхід до інтеграції знань у мовні моделі для зменшення галюцинацій.

Можливі розширення

Налаштування з використанням предметних даних: Покращення точності шляхом налаштування моделі з використанням предметних наборів даних.
```
from datasets import load_dataset

# Завантаження предметного набору даних
dataset = load_dataset('your_dataset')

# Код налаштування тут
```
Впровадження графів знань: Інтеграція зовнішніх баз знань, таких як Wikidata, для валідації та доповнення згенерованої інформації.
Використання більших моделей: Використання більш просунутих моделей, таких як GPT-3 або GPT-4, за допомогою відповідних API.

Висновок

Застосування методів дослідження ліків для дистиляції моделей ШІ відкриває багатообіцяючі можливості для підвищення точності та зменшення галюцинацій. Хоча деякі методи вже використовуються в моделях ШІ, є місце для подальших інновацій за допомогою міждисциплінарного підходу. Виклики полягають у відмінностях типів даних і масштабованості. Проте інтеграція методів з автоматичного дослідження ліків в дистиляцію моделей ШІ може призвести до значних покращень у дослідженнях ШІ.

Додаткове роздумування: Чи має сенс?

Дослідження ліків і природна мова, хоч й різні, обидва використовують складні правила та структури. Методи моделювання та прогнозування в дослідженні ліків можуть дати цінний імпульс для обробки природної мови. Важливо бути відкритим до міждисциплінарних підходів, оскільки інновації часто виникають на перетинах різних галузей.

Реалізація для зменшення галюцинацій у LLM з використанням Hugging Face

У цьому документі показано, як створити мовну модель з оцінкою невизначеності за допомогою Hugging Face та Python, щоб зменшити галюцинації. Ми використовуємо техніки, натхненні методами в автоматичному дослідженні ліків, зокрема оцінку невизначеності через Monte Carlo Dropout.

<h4>Передача даних на квантовому рівні за допомогою кремнієвих чипів.</h4> <p>&l

<h4>Intel та Google & Co. розробляють машинне програмування.</h4> <p><span class="infob

<h4>Перший DNA / біокомп'ютер, який обчислює квадратний корінь з 900.</h4> <p><spa

<h2>Зливно-синтезний реактор як генератор гравітації.</h2> <p><span class="infobox&qu

<h4>Частиновий прискорювач у розмірі мікросхеми.</h4> <p><span class="infobox">09

<h1>Безенявання</h1> <p><span class="infobox">21.08.2020</span></p> <p>Чиста вига

<h1>Імплантовані посилення</h1> <p><span class="infobox">21.08.2020</span></p> <p&g

<h1>Логічні схеми комп'ютерів на квантовому рівні стискаються.</h1> <p><span c

<h1>Виробництво енергії з екзотичних частинок.</h1> <p><span class="infobox">22.08.

<h1>Виробництво золота в атомному реакторі.</h1> <p><span class="infobox">25.08.2020&l

<h1>Нейтрино бомби з глибин квантових рівнів</h1> <p><span class="infobox">28.08.2020&

<h1>Terra Scale Internet cherez ol’ dni plynovykh tsvetok</h1> <p><span class="infobox">31.08.2020</span><

<h1>Заломлення в ізольовані мережі за допомогою індукції</h1> <p><span class="infob

<h1>Наноботи (Квантові боти) в електричному ланцюгу</h1> <p><span class="infobox"&g

<h1>Інтелектуальний Frubber</h1> <p><span class="infobox">27.12.2020</span></p> <p>Frubb

Буття, становлення, велика і найменша частинка, все Спочатку не було нічого.

<h1>Чи можливий термоядерний реактор з використанням урану як палива, видобутого з

Часпрям-Візія 20.02.2024 Часпрямна візія описує технологію, я�

<h1>Лісові супутники для захисту від прибульців</h1> <p><span class="infobox">21.0

<h1>Сценарій глобального енергетичного колапсу через експоненційне нагрівання Зе

<h1>Авто Визначення Кластерів Програмне ПЗ (ALCS) – Кроки до Реалізації Розподілен

<h1>ToNEKi Media залучається до сталого розвитку</h1> <p>ToNEKi Media – це компанія, яка

<h1><span style="font-size: 1em;">HighOS: Коли майбутнє стає рівним</span></h1> <p><span s

<h1><span style="font-size: 1em;">Втрачений у глибинах HighOS:</span></h1> <p><span style=&qu

<h1>Зараз* готуємо з сатирою! 🔥</h1> <p><span class="infobox2">ЖАРТИ,Joke,Kawały,Dowcipy<

<h1>Тут суміш темної сарказмічної комедії з логікою **Стелера**, **0 IQ романтики** та т�

<h1>Любовь — это сложная и многогранная концепция, которую трудно уложить в одно

<h1>Ось версія НАТО сатири – з грайливою ноткою та дозою геополітичної абсурдно�

<h1>Гемма 3: ШІ, який обчислює Всесвіт, поки ви все ще розмірковуєте над питанням</h1

<h1>ChatGPT: ШІ, який обчислює Всесвіт, поки ти ще розмірковуєш над питанням</h1> <p>

<h1>LLaMA 3.3: Швидка штучний інтелект, який думає швидше, ніж ви гуглите</h1> <p><spa

<h1>Давай з'єднаємо хаотичну атмосферу "нульової інтелектуальності" з мист

<h1>Тут сатиричний розрахунок з **помилками під час будівництва** та таємничими, що �

<h1>Ось сатирична порція німецького парламенту з SPD, CDU та іншими – звісно, у форм�

<h1>"Чому 0-інтелектуальні прибульці зазнали невдачі під час вторгнення на Землю

<h1>Якщо ягуар стає білкою: Погляд у дивовижий світ нішників</h1> <p><span class="

<h1>Ось порція сатиричного політичного гумору про **XXL-палати** та *підвищення депут�

<h1>Ось приходить сатиричний **вірус Bitcoin** з хаосом блокчейну, форками та ноткою кри

<h1>Тут є 10 вигаданих законів для хижаків</h1> <p><span class="infobox2">ВІДПУЩКА,

<h1>Ось космічна романтична комедія між **HAL 9000** та **Siri** – з розами, сарказмом та к

<h1>Тут приходить сатиричний дотик **технологічного страху** — з ноткою іронії що

<h1>Ось темна-сатирична версія **Світу хакерів-вимагачів**</h1> <p>Звичайно, повн

<h1>Ось прикольна-переколена **Матриця-Психіатрія-Мікс** — зовсім без стигматиза�

<h1>Тут порція сатири про **багатих людей** – звичайно, вигадана, перебільшена та �

<h1>Ось незвичайна історія з коду Brainfuck і хаосу тесту Тьюринга – з великою дозо

<h1 data-pm-slice="1 1 []"><strong>Вітрові електростанції як контроль за погодою?</strong&

<h1 data-pm-slice="1 1 []"><strong>Чорні сонячні панелі та їхній вплив на потепління Зем

<h1>Тесла-гітарка: Коли Всесвіт дивиться на вас у рот</h1> <p><span class="infobox2"

Okay, that's an *extensive* and fascinating deep dive into the economics of data! It’s a really comprehensive overview covering everything from

<h1>Економіка 4.0 потребує податкового мислення 4.0: Чому майбутнє оподаткування має

<h2 data-start="192" data-end="238">🧬 ПРОТОКОЛИ ЗНИЩЕННЯ КЛОНІВ ТРИМИ СЕКУНДАМИ</h2>

<h1>Заморожування продуктів у холодильнику: Необхідність регулярної дезінфекції �

<h1><strong>Наукова стаття: Експоненційне клітинне зростання, виникнення раку та с�

<h1>Лазерне спостереження за залізницею за допомогою дзеркальних геометрій та мул

<h1><strong>Титл: Технологія імпульсів в автомобільбудуванні – Нове покоління а�

<h3>Тепер до ідеї: Що потрібно зробити, щоб полілітій високоочистити?</h3> <p><

<h1>Геотермальна енергія під напругою - Приховані ризики з геохімії, структуроморф

Розгорнутий список важливих символів Unicode 1. Латинські літери (A–Z, a–