Точнее будет тема: "Computer Vision для нейро-лектора"
Что мы хотим сделать:
🧬 нейро-лектор проводит для вас персональное занятие в Google Colab
🧬 проводит голосом и прямо при вас пишет код, запускает ячейки Colab и скроллит ноутбук
🧬 нам нужно уметь распознавать, что видят на экране лектор и студент
🧬 потом нам нужно уметь двигать мышкой, кликать на кнопки и печатать код в Colab
🧬 ну и нам нужно, чтобы GPT генерировала ответы и сценарий, что сейчас делаем мышкой
Так вот, мы сейчас сделаем пункт 3 — распознавание того, что сейчас на экране
Это первая сложность, с которой мы сталкиваемся при создании нейро-лектора
Будем распознавать:
💥 кнопки запуска ячеек
💥 скролл
💥 пункты меню
💥 тексты в Colab
💥 блоки кода в Colab
Обнаруживаем всё с помощью Object Detection (Yolov8), распознаем тексты с помощью OCR
🌎 Собственно, к вебинару мы разметим базу, обучим нейронки и покажем вам распознавание на отдельных скриншотах и видео из Colab
🔥🔥🔥 Обязательно регистрируйтесь
Встречаемся во вторник, 27 августа, в 19:00 https://neural-university.ru/baza_web_27082024?utm_source=webinar&utm_medium=23082024&utm_campaign=smm
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев