Поиск забытой музыки с Data.world
Кратко
Data.world позволяет быстро находить исторические музыкальные наборы данных и превращать их в плейлисты или исследования. В статье показано, как найти наборы Billboard и Spotify, отфильтровать нужные записи и экспортировать треки в сервисы для воспроизведения. Включены чек-листы, пример SQL‑запроса и рекомендации по альтернативам.

Каждый раз, когда по телевизору или в фильме звучит старая песня, которая когда‑то была хитом, это небольшой шрам памяти. Музыка — не просто развлечение. Со временем мы теряем след тех треков, которые формировали культуры и личные истории. Исследование музыкальной истории помогает лучше понять себя и общество.
Важно: иногда самые ценные находки — это те записи, которые не попали в чарты повторно или были локально популярны. Эти «скрытые сокровища» часто требуют фильтрации по автору, году и региону.
Начало работы с Data.world

Data.world — это социальная платформа для поиска и обмена наборами данных. Она позволяет создавать проекты, использовать публичные данные и подключаться к популярным инструментам аналитики. Для персонального использования доступен большой бесплатный тариф.
Шаги для старта:
- Зарегистрируйтесь и войдите в учётную запись.
- В строке поиска в центре страницы введите запрос «Billboard hot weekly charts».
- Выберите проект, который содержит тысячи закладок и наборов данных.

Нажмите кнопку закладки, чтобы быстро вернуться к набору данных позже.

В проекте обычно два ключевых файла: CSV с историей чартов и Excel с аудиофичерами от Spotify. CSV содержит позиции чартов по датам, а Excel — метрики треков (danceability, energy, popularity и т. п.). В наборе порядка 30 000 уникальных песен, так что потребуется сортировка и фильтрация.
Просеивание музыкальных данных
Проект включает два отдельных набора: один по Billboard, другой — по Spotify. Оба полезны, но служат разным целям.
Данные Billboard
Откройте файл HotStuff.csv — в нём реальные записи Billboard Hot 100 с 1958 года. Это мощный источник для исторического анализа: какие песни и исполнители попадали в чарты, когда были пики популярности и как менялись тенденции по десятилетиям.
Советы по работе с CSV:
- Скачайте файл и импортируйте в Google Sheets или Microsoft Excel, если веб‑интерфейс загружается медленно.
- Используйте сортировку по столбцу даты и позиции чарта, чтобы найти топовые треки за конкретный период.
- Фильтруйте по исполнителю, году или стране (если доступно) для локальных подборок.

Если файл большой, сортировка в браузере может быть медленной. Экспорт в локальную таблицу часто даёт лучшее взаимодействие.

Данные Spotify

Файл “Hot 100 Audio Features.xlsx” содержит технические метрики треков, собранные из Spotify: danceability, energy, tempo, loudness и рейтинг популярности. Это отличный источник для создания тематических плейлистов (например, «танцевальные хиты 1970‑х») или для анализа музыкальной эволюции.

Поскольку в этом файле около 30 000 записей, он обычно отзывчивее и не требует экспорта.
Гиковская работа с данными (SQL)
Если вы знаете SQL, Data.world особенно удобен: можно выполнять запросы прямо в браузере.
Пример: все треки Adele, которые попадали в Top‑10 Billboard.
SELECT *
FROM HotStuff
WHERE artist = 'Adele'
AND peak_position <= 10
ORDER BY peak_position, week_date;Как выполнить запрос:
- Откройте нужный набор данных на Data.world.
- Нажмите “query” в правом верхнем углу (название UI оставлено как в интерфейсе).
- Введите SQL и нажмите “Run query”.
Бонус: сохраните запрос как «bookmark» или экспортируйте результат в CSV для дальнейшей работы.
Важно: в названиях исполнителей могут быть вариации (например, “Adele” vs “Adele feat. Someone”). Используйте LIKE или нормализуйте строки перед фильтрацией.
Как экспортировать треки в Spotify (быстрая инструкция)
Mini‑методология — шаги от данных к плейлисту:
- Отфильтруйте треки по дате/исполнителю/позиции чарта.
- Экспортируйте список треков (CSV) с колонкой artist и title.
- Используйте инструмент для импорта (например, Soundiiz) для создания плейлиста в Spotify.
- Проверьте совпадения треков вручную и откорректируйте несопадения.
Чек‑лист перед экспортом:
- В списке есть оба поля: artist и title.
- Очищены примечания и скобки в названиях.
- Проверены дубликаты по исполнителю и названию.
- Экспорт сохранён в UTF‑8, чтобы избежать проблем с кириллицей.
Альтернативы импорта: кроме Soundiiz можно использовать TuneMyMusic, MusConv и собственные скрипты на Python с Spotify API.
Полезные модели мышления и альтернативные подходы
- Модель «популярность × активность»: фильтруйте не только по пиковым позициям, но и по длительности нахождения в чарте — так вы найдёте треки с устойчивой популярностью.
- Подход «технических метрик»: ищите песни с похожими danceability и energy, чтобы собрать тематические плейлисты (ретро‑дэнс, меланхоличный поп и т. п.).
- Когда это не работает: если метаданные отсутствуют или написаны с ошибками, попробуйте объединить данные с другими источниками (MusicBrainz, Discogs).
План действий для роли «исследователь музыки»
- Исследователь: ищет исторические паттерны и локальные хиты. Сфокусируйтесь на CSV Billboard.
- Куратор плейлистов: выбирает треки по настроению и метрикам. Работайте с Excel Spotify и Soundiiz.
- Аналитик: строит визуализации и отчёты. Экспортируйте в Google Data Studio или используйте Pandas/SQL.
Диаграмма принятия решения
flowchart TD
A[Нужна историческая популярность?] -->|Да| B[Использовать HotStuff.csv — Billboard]
A -->|Нет, нужны аудио‑фичеры| C[Использовать Hot 100 Audio Features.xlsx — Spotify]
B --> D[Фильтрация по дате и позиции]
C --> E[Фильтрация по danceability/energy]
D --> F[Экспорт в CSV → Soundiiz]
E --> FКогда Data.world может не подойти
- Если вам нужны права на коммерческое использование треков и аудио — Data.world предоставляет данные, но не лицензию на музыку.
- Если наборы содержат мало метаданных или много опечаток — потребуется ручная очистка.
Вопросы и ответы
Можно ли использовать эти данные для коммерческих проектов?
Данные на Data.world, как правило, публичны, но лицензии могут отличаться. Проверьте лицензию конкретного набора перед коммерческим использованием и отдельно оформляйте права на аудио‑файлы у правообладателей.
Сколько треков в наборе данных?
Около 30 000 уникальных записей в совокупности по проекту, но точное число зависит от версии набора данных.
Что делать, если мой трек не сопоставился в Soundiiz?
Проверьте написание исполнителя и названия, удалите части в скобках и попробуйте сопоставление вручную.
Итог и рекомендации
- Data.world — удобный старт для поиска исторических музыкальных данных.
- Для исторического анализа используйте CSV Billboard; для плейлистов и метрик — Excel Spotify.
- Экспортируйте результаты в локальные таблицы, чистите метаданные и импортируйте в Soundiiz или через API Spotify.
Краткая сводка:
- Используйте SQL для быстрых выборок.
- Нормализуйте названия исполнителей перед сопоставлением.
- Проверьте лицензию набора данных при коммерческом использовании.
Дополнительные ресурсы: MusicBrainz и Discogs для обогащения метаданных, Soundiiz и TuneMyMusic для импорта в стриминговые сервисы.
Похожие материалы
nOS для Nintendo Switch: превратите консоль в мини‑ПК
Как перенести остров Animal Crossing на новый Switch
Форматирование текста в Facebook Messenger
Как подключить Joy‑Con к Steam
Как пережить долгий процесс собеседований