У першому уроці ми розглянули, чому ШІ стає новою інфраструктурою для торгівлі криптовалютою. Головне питання: як би не був потужний ШІ, він працює лише в межах даних, які Ви надаєте.
Більшість стратегій зазнають невдачі не через надмірну простоту моделі, а через напрямні помилки на рівні даних: недостатню якість, викривлений дизайн ознак або упереджені методи перевірки.
Тому реальна торгівля із ШІ починається не з “вибору моделі”, а з “побудови основи даних”. Те, що Ви подаєте моделі, визначає її можливості; те, що вона бачить, визначає її рішення.
Трейдери, які вперше працюють із ШІ, часто схильні до “накопичення даних”: збирають усе, вважаючи, що більше ознак спростить пошук Alpha.
Насправді дані низької якості, шумні, слабко корельовані, знижують стабільність моделі. Причина проста:
Перший принцип побудови системи даних:
Обирайте дані навколо торгових задач — не шукайте задачі навколо даних.
Якщо Ви вирішуєте задачу “прогнозу короткострокового напрямку”, пріоритет — мікроструктура та шоки настроїв; якщо працюєте над “керуванням середньостроковими позиціями”, зосередьтеся на ліквідності, структурі волатильності та макро-факторах.

У крипторинках найцінніші дані зазвичай надходять з чотирьох рівнів: ринкові дані, деривативи, ончейн та зовнішня інформація.
Це основа для всіх стратегій, включаючи:
Відповідає на питання: як змінюються ціни, ліквідність, поведінка торгівлі.
Багато базових стратегій можна побудувати лише на ринкових даних, але їх обмеження: це радше “змінна результату”, з обмеженою пояснювальною силою щодо “чому відбуваються зміни”.
Особливо важливі для крипторинків, включаючи:
Ці дані відображають скупчення кредитного плеча та вразливість позицій.
Наприклад, “зростання ціни + зростання відкритого інтересу + висока ставка фінансування” проти “зростання ціни + падіння відкритого інтересу” означають різне. Перше може сигналізувати про посилення тренду чи скупчення кредитного плеча; друге ймовірніше зумовлене покриттям шортів.
Без виміру деривативів складно оцінити структуру позицій за рухами ринку.
Ключова перевага, що відрізняє крипторинки від традиційних, включає:
Цінність ончейн-даних — у спостереженні за траєкторіями капіталу та поведінки, але складність — у затримці інтерпретації та фільтрації шуму.
Наприклад, збільшення притоку на біржу може означати підготовку до продажу або хеджування. Ончейн-дані слід трактувати разом із структурою цін і даними деривативів — використання лише їх легко призводить до хибних рішень.
Включають новини, обговорення у соцмережах, події політики, часи публікації макро-даних.
Це радше джерела шоку: пояснюють, чому волатильність раптово зростає або тренди короткочасно змінюються.
Такий тип даних має очевидні проблеми: дуже суб’єктивні, шумні, змішані правдиві та хибні дані.
Зовнішній текст краще використовувати як фактори попередження ризику та фільтри подій, не рекомендується як єдиний сигнал входу.
ШІ не розуміє ринкових наративів напряму; він розпізнає лише патерни ознак.
Другий крок — не поспішати тренувати моделі, а трансформувати сирі дані у навчені, перевірені, торговані ознаки.
Поширені корисні ознаки можна згрупувати у чотири категорії:
Важливі не “яскраві ознаки”, а три критерії:
Багато хто за замовчуванням просить модель прогнозувати “наступну K-лінію вверх/вниз”, але це не завжди оптимально.
Торгові цілі можуть мати різні форми міток:
Якщо Ваша стратегія — уникати великих просідань, а Ви використовуєте короткостроковий напрямок ціни як мітку, навіть дуже точна модель може бути не корисною.
Мітки повинні відповідати цілям стратегії: який прибуток Ви шукаєте в торгівлі, таку ціль має вивчати модель.
У типових задачах машинного навчання випадкове перемішування навчальних і тестових наборів є поширеним і обґрунтованим; але в торгівлі це викликає серйозне спотворення.
Ринки мають структуру залежності від часу — майбутня інформація ніколи не повинна просочуватися у минуле.
Торгівля із ШІ повинна дотримуватися мінімум трьох правил перевірки:
Багато “стратегій-чудес у бектесті” розвалюються не через погіршення ринку, а через оптимістичні упередження у методах тестування з самого початку.
Використання недоступних на момент часу даних призводить до завищених результатів.
Навчання лише на монетах або платформах, що вижили, ігнорування невдалих зразків.
Видалення реального шуму як брудних даних — модель втрачає адаптивність до екстремальних ринків.
Ознаки неявно містять інформацію мітки — модель здається надто точною.
Вимушене використання низькочастотних ончейн-ознак у високочастотних торгових задачах — виникають хибні сигнали.
Ці проблеми не виникають під час бектестування, але швидко посилюються у реальній торгівлі.
Для учнів курсу найбезпечніший підхід — не починати з мега-моделі з усіма факторами ринку, а розпочати з мінімально життєздатного фреймворку даних:
Такий підхід забезпечує чітку локалізацію проблем, низькі витрати на ітерацію та короткий шлях до розгортання.
Складні системи не створюються одразу — вони розширюються шар за шаром від інтерпретованих малих систем.
У реальній реалізації етап даних часто займає найбільше часу: збір із різних джерел, очищення формату, синхронізація часу, побудова конвеєрів ознак, інтеграція стратегій.
Саме тому платформні ШІ-інструменти стають дедалі важливішими. Gate for AI як приклад такої інфраструктури — цінність не у створенні універсальної стратегії для Вас, а у допомозі трейдерам ефективно завершувати інженерний цикл від даних до стратегії та знижувати тертя між дослідженням і виконанням. Трейдери все одно мають визначати задачі, встановлювати обмеження, керувати ризиками — але базові робочі процеси можуть бути більш стандартизованими та повторюваними.