Perepis 1170x160

8(495)912-63-37 
gmc@edu.mos.ru
FacebookВКонтактеYouTubeInstagram

Пятница, 24 Сентябрь 2021 16:56

Программа элективного курса «Большие данные», 10–11 класс, 64 часа

I. Планируемые результаты освоения учебного курса

Личностные:

– формирование мировоззрения, соответствующего современному уровню развития науки;
– формирование основ саморазвития и самовоспитания в соответствии с уровнем развития общества;
– готовность и способность к самостоятельной, творческой и ответственной деятельности;
– развитие навыков сотрудничества со сверстниками, взрослыми в образовательной, общественно полезной, учебно-исследовательской, проектной и других видах деятельности;
– осознанный выбор будущей профессии и возможностей реализации собственных жизненных планов.

Метапредметные:

– самостоятельно определять цели деятельности и составлять планы деятельности;
– самостоятельно осуществлять, контролировать и корректировать деятельность;
– использовать все возможные ресурсы для достижения поставленных целей и реализации планов деятельности;
– выбирать успешные стратегии в различных ситуациях;
– применять навыки познавательной, учебно-исследовательской и проектной деятельности в повседневной жизни;
– использовать средства информационных и коммуникационных технологий в решении прикладных задач.

Предметные:

– владеть терминологическим аппаратом;
– вычислять вероятности случайных событий;
– применять формулы комбинаторики;
– применять библиотеки math, numpy, random, pandas и др.;
– оценивать параметры распределений. Производить интервальные оценки;
– использовать методы решения задачи регрессии;
– различать методы машинного обучения по их типам;
– оценивать параметры распределения случайной величины;
– строить и исследовать модели из различных предметных областей с использованием выбранных языков программирования и электронных таблиц;
– применять нейронные сети для решения различных прикладных задач;
– использовать основные понятия корреляционного анализа. Парный коэффициент корреляции. Корреляционные матрицы;
– оценивать параметры распределения случайной величины;
– конструировать и обучать нейронные сети;
– моделировать нейронные сети на языке Python.

II. Содержание курса

Работа с данными в Python

Математика в Python. Библиотеки math, numpy, random. Работа с табличными данными. Библиотека pandas. Работа с текстовыми данными. Библиотеки spacy, ntlk. Работа с файлами с нетривиальной разметкой, JSON и XML. Библиотека json. Работа с изображениями. Библиотека pil. Работа с видео. Библиотека opencv. Работа с аудио. Библиотеки pydub, simpleaudio, pyaudio, sounddevice

Визуализация данных в Python

Визуализация данных, графики Matplotlib. Визуализация изображений (карт). Библиотека folium. Визуализация табличных данных. Графики в pandas. Библиотеки seaborn, plotly. Визуализация звуковых данных. Библиотека librosa.

Введение в машинное обучение

Задачи машинного обучения. Линейная и логистическая регрессия в библиотеке sklearn. Деревья решений и случайный лес в библиотеке sklearn. Библиотека graphviz. Реализация и презентация проекта по модулю.

Машинное обучение

Машины опорных векторов в библиотеке sklearn. Байесовские модели в библиотеке sklearn. Методы ближайших соседей в библиотеке sklearn. Ансамбли: беггинг в библиотеке sklearn. Ансамбли: бустинг в библиотеках sklearn, xgboost, catboost. Ансамбли: стекинг в библиотеке sklearn. Матричные разложения. Метод главных компонент, метод T-SNE и анализ независимых компонент в библиотеке sklearn. Кластеризация. Алгоритм K-средних, Иерархическая кластеризация, Метод DBSCAN в библиотеках scipy и sklearn. Обучение метрических преобразований, метод LMNN в библиотеке sklearn. Подбор гиперпараметров.

Нейронные сети. PuzzleLib

Нейронные сети. Фреймворки глубокого обучения. Библиотека PuzzleLib. Многослойный персептрон. Реализация в PuzzleLib и sklearn. Играем с персептроном. Playground Tensorflow. Сверточные нейронные сети. Реализация в Keras и PuzzleLib. Реализация итогового проекта. Презентация результатов итогового проекта.

III. Тематическое планирование

№ п/п

Темы

Всего часов

1.

Работа с данными в Python

14

2.

Визуализация данных в Python

8

3.

Введение в машинное обучение

10

4.

Машинное обучение

20

5.

Нейронные сети. PuzzleLib

12

 

Итого:

64