[Из песочницы] Изучаем данные, собранные Xiaomi Mi Band за год
Введение
Люди носят фитнес-браслеты по разным причинам, я могу предположить некоторые из них:
- Для того, чтобы поддерживать себя в форме и выполнять цели по активности;
- Потому что это некая модная штучка;
- Чтобы ставить над собой эксперименты или узнать себя лучше.
В этой заметке я хочу рассказать о том, как можно извлечь данные из браслета и попробовать получить некоторые зависимости. Я ношу фитнес браслет по причине номер 3.
Методы для извлечения этих данных работают для Mi Band 1, 1S и, возможно, 2 (приложение для 2, кажется, такое же).
Извлечение данных
В случае Android'a делается это предельно просто см. Для извлечения данных с браслета в первую очередь надо достать с телефона SQLite базу данных, в которой хранятся собираемые метрики. топик на форуме xda-developers, скрипты под актуальную базу:
- Подключаем Android телефон с включенным режимом отладки по USB к компьютеру;
- Делаем бэкап приложения:
adb backup -f mi.ab -noapk -noshared com.xiaomi.hm.health
; - Создаем
dd if=mi.ab bs=1 skip=24 | python -c "import zlib,sys;sys.stdout.write(zlib.decompress(sys.stdin.read()))" > mi.tar
; - Распаковываем архив с БД:
tar xvf mi.tar apps/com.xiaomi.hm.health/db/ 2>&1 | tee -a log
; - Копируем БД:
cp -f apps/com.xiaomi.hm.health/db/origin_db* ./db/
.
Как результат, мы получаем SQLite базу данных с именем файла db/origin_db_[0-9]+$
, в которой хранятся метрики Mi Band.
Загрузка и анализ данных
Для изучения данных, на мой взгляд, удобно использовать IPython notebook: Xiaomi_Mifit_miband_data.ipynb
Метрики хранятся в таблице DATE_DATA:
df = pd.read_sql_query("SELECT * from DATE_DATA", con)
Колонки в таблице, которые представляют интерес:
Агрегированные за день данные
Агрегированные данные хранятся в виде JSON:
,"v":5,"goal":8000,"stp":{"rn":2,"cal":257,"runDist":256,"wk":69,"ttl":5244,"runCal":13,"dis":3817}}
Для сна хранится время начала и окончания — st, ed, а также время глубокого и легкого сна в минутах — lt, dp. Данные делятся на 2 части: сон (slp) и активность (stp). Для активности хранится суммарное количество "шагов" ttl — сумма показаний первичного датчика за день и другие производные величины func(ttl, рост, вес)
. Также хранится время просыпания между между началом и окончанием сна — wk.
Сырые данные активности и пульса
Первое значение — сон и значение от 0 до 127 (но в моем случае максимум 126), второе и третье — активность со значением от 0 до 255 (у меня максимум activity2 — 189, activity3 — 240). Сырые данные активности сохраняются каждую минуту (за сутки 1440), и представляют собой 3 значения за кажду минуту.
Пульс сохраняется каждую минуту и имеет значения от 0 до 255.
Как сырые данные превращаются в агрегированные за день
Со сном сложнее: я так и не научился сырые данные сна превращать в агрегированные. Самый простой агрегат — это количество шагов за день — сумма значений activity3 за день. На форумах высказывалась мысль о том, что значение activity1 == 4 глубокий сон, а 5 — легкий, но так же просто, как с шагами, установить взаимосвязь между агрегированными данными и сырыми не получается.
Анализ данных
Это значение оказалось ~ (7 +- 1) час. Во-первых, сколько я спал в течение года. Кажется, с этим все ок.
Другая очевидная вещь — высыпаюсь я по выходным:
А в пятницу — самое плохое качество сна, боюсь даже предположить почему. А если назвать отношение глубокого сна к легкому качеством, то выяснится, что лучшее качество сна у меня в четверг, и при этом глубой сон составляет 23% от всего времени сна.
Максимальное количество "шагов" я совершаю в пятницу и субботу:
При этом среда у меня — день, когда я мало сплю и мало хожу, очевидных объяснений из разряда "я работаю из дома" — нет, поэтому это что-то новое для меня.
Надеюсь, что кто-нибудь из обладателей популярных браслетов Mi band тоже захочет поизучать себя и расскажет о своих особенностях.