Тематический план

  • Общее

  • Поиск научных статей. Перевод текстов

    Цели и задания

    1. Научиться пользоваться нейронными сетями SEMANTIC SCHOLAR, Elicit, Litmaps для поиска научных статей.

    2. Выполнить поиск статей по теме ВКР.

    3. Научиться пользоваться нейронной сетью DeepL для перевода pdf файлов.

    4. Выполнить перевод статей по теме ВКР.

    5. Оформить отчет в Overleaf.

    6. Научиться пользоваться сервисом https://playground.com/design

    7. Создать несколько объектов дизайна в Designed-Playground.

  • Нейросети для работы с текстом. Bib файлы. Формулы

  • Нейросети для работы с таблицами

  • Нейросети для работы с видео. Создание списка литературы с помощью ИИ

    Цели и задания

    1. Научиться пользоваться нейронными сетями pictory, invideo для создания обучающих роликов.

    2. Создать видео с помощью pictory из URL и презентации.

    3. Создать видео с помощью invideo.

    4. Создать видео с помощью https://creator.nightcafe.studio/.

    5. Создать видео с помощью https://www.renderforest.com/

    6. Составить список литературы по теме ВКР с помощью одной из сетей:
        1. ruGPT. https://rugpt.io/
        2. Кампус AI. https://kampus.ai/
        3. Online GPT. https://study24.ai/
        4. АйБро. https://aibro.io/
        5. GPT-tools. https://gpt-tools.ru/
        6. ChatInfo. https://chatinfo.ru/
        7. MitupAI. https://ai.mitup.ru/ 

    7. Оформить отчет в Overleaf.


  • Gradio

    1. Освоение базового функционала

    • Цель: Научиться создавать простые интерфейсы для демонстрации функций или моделей.
    • Пример: Создать интерфейс для функции, которая принимает текст и возвращает его в верхнем регистре.
    • Результат: Понимание основных компонентов Gradio (входы, выходы, запуск интерфейса).


    2. Интеграция с моделями машинного обучения

    • Цель: Научиться подключать Gradio к моделям машинного обучения (например, TensorFlow, PyTorch, Hugging Face).
    • Пример: Создать интерфейс для модели классификации текста или изображений.
    • Результат: Умение использовать Gradio для интерактивного тестирования моделей.


    3. Работа с различными типами данных

    • Цель: Освоить обработку и отображения разных типов данных (текст, изображения, аудио, видео, таблицы).
    • Пример: Создать интерфейс для загрузки изображения и применения к нему фильтра (например, черно-белого).
    • Результат: Понимание, как работать с различными компонентами Gradio (например, gr.Image, gr.Audio).


    4. Создание сложных интерфейсов

    • Цель: Научиться создавать многостраничные или многофункциональные интерфейсы.
    • Пример: Разработать интерфейс с несколькими вкладками, где каждая вкладка выполняет разные задачи (например, обработка текста и изображений).
    • Результат: Умение использовать gr.Tab, gr.Row, gr.Column и другие компоненты для создания сложных интерфейсов.

  • NLP - Natural Language Processing

    Natural Language Processing (NLP) — это область искусственного интеллекта (AI), которая занимается взаимодействием компьютеров и человеческого языка.

    Что делает NLP?

    NLP позволяет машинам:

    • Понимать текст и речь (анализ смысла, тональности, извлечение фактов).
    • Генерировать текст (ответы в чат-ботах, перевод, summarization).
    • Обрабатывать языковые данные (токенизация, исправление ошибок, классификация).


    Примеры задач NLP:

    1. Классификация текста (спам/не спам, тональность отзывов).
    2. Машинный перевод (Google Translate, DeepL).
    3. Чат-боты и голосовые ассистенты (Siri, ChatGPT).
    4. Извлечение именованных сущностей (NER) (поиск имён, компаний, дат в тексте).
    5. Генерация текста (GPT, нейросети для написания статей).
    6. Ответы на вопросы (как в поисковых системах).


    Основные этапы обработки текста:

    1. Токенизация — разбиение текста на слова/предложения.
    2. Лемматизация/стемминг — приведение слов к базовой форме ("бежал" → "бежать").
    3. Удаление стоп-слов (предлоги, частицы).
    4. Векторизация — преобразование текста в числа (TF-IDF, Word2Vec, BERT).
    5. Обучение модели (классификация, кластеризация, генерация).


    Популярные инструменты и библиотеки:

    • Python-библиотекиNLTKspaCyTransformers (Hugging Face), Gensim.
    • Предобученные модели: BERT, GPT, T5.
    • Фреймворки: TensorFlow, PyTorch.