Data Engineering
•
8 min read
Веб‑скрапинг: создать датасет на примере IMDb
Веб‑скрапинг позволяет собрать кастомный датасет, когда API отсутствует. В статье — пример на IMDb: код на Python, очистка данных, тесты, этика и рекомендации по масштабированию.