Як розмістити майбутнє багатство через AI Agent? Ця стаття дасть вам відповідь

Автор оригінального тексту: Rocky

Повторне опублікування: Daisy, Mars Finance

Про #AI Агента потрібно знати, ця книга (папір) обов'язкова до прочитання кожному. ЛІ ФЕЙФЕЙ "АГЕНТ АЙ", ЦЕ НАЙСВІЖІША І МАЙБУТНЯ КНИГА З РЕЖИСУРИ, ЯКУ Я БАЧИВ В ЦЬОМУ РОЦІ, І ПОВНИЙ ТЕКСТ НЕ СКЛАДНИЙ ДЛЯ РОЗУМІННЯ, В НЬОМУ НЕМАЄ ГЛИБОКИХ ПРОФЕСІЙНИХ ТЕРМІНІВ І ЛОГІКИ АЛГОРИТМУ, ЙОГО ВАРТО ПРОЧИТАТИ КОЖНІЙ ЗВИЧАЙНІЙ ЛЮДИНІ, А В КІНЦІ СТАТТІ Є ПОВНОТЕКСТОВЕ ПОСИЛАННЯ НА КОМЕНТАРІ.

Я можу з відповідальністю сказати всім: AI Agent - це найбільш перспективна сфера інвестицій в галузі штучного інтелекту в середньому і пізньому етапах (незалежно від того, чи це американський фондовий ринок, чи сфера Web3), це також найближча до напрямку, який може відчути To C, для звичайних людей це найпряміший шлях спілкування та використання великомасштабної сфери.

Як це описано в його вступній статті: огляд системи AI Agent, ця система може сприймати і діяти в різних галузях і застосуваннях. AI Agent - це перспективний шлях до загального штучного інтелекту (AGI). Навчання AI Agent вже довело свою здатність до багатомодального розуміння фізичного світу. Він надає рамки для нереального навчання, поєднуючи генеративний штучний інтелект з кількома незалежними джерелами даних. Ми пропонуємо загальний огляд системи штучного інтелекту агента, яка може сприймати та діяти в багатьох різних галузях і застосуваннях, як парадигму для AGI.

У статті особливу увагу приділяють стану технології мульти-модальної взаємодії між людиною та штучним інтелектом (HCI), перспективам застосування та напрямкам майбутнього розвитку AI Agent. Деякі ключові технології та інноваційні напрямки, що проявляються з цього, варто ретельно проаналізувати й дослідити, щоб не дозволити AI Agent обмежуватися лише голосовою та візуальною взаємодією, оскільки його потенціал значно ширший:

  1. Основні поняття та значення багатомодального HCI

Мульти-модальний ІЧІ шляхом інтеграції різних інформаційних режимів, таких як голос, текст, зображення, дотик і т.д., досягає природної, гнучкої та ефективної взаємодії між людиною та комп'ютером. Основною метою цієї технології є:

• Підвищення природності та поглиблення взаємодії.

• Розширити придатність сценаріїв взаємодії людини і машини.

• Підвищення здатності комп'ютера розуміти різноманітність введення від людини.

  1. Напрямки майбутнього розвитку

У статті було проведено систематичний огляд з п'яти дослідницьких галузей:

  1. Візуалізація та взаємодія з великими даними

Концепція: перетворення складних даних на зрозуміле графічне відображення, що збільшує відчуття користувача через багатоканальний сприймання (зорове, тактильне, слухове тощо).

Прогрес:

• Дослідження візуалізації даних на основі віртуальної та підвищеної реальності (VR та AR)

• У медичній та науковій галузі відчуттєвий зворотній зв'язок (такий як відчуття сили та вібрації) допомагає користувачеві краще зрозуміти розподіл даних.

Застосування:

• Smart City Monitoring: відображення даних про дорожній рух міста в режимі реального часу за допомогою динамічних теплових карт.

• Аналіз медичних даних: багатовимірне дослідження даних у поєднанні з тактильним зворотним зв'язком.

  1. Звукова взаємодія на основі сприйняття звукового поля

Концепція: використання масиву мікрофонів та алгоритмів машинного навчання для аналізу змін акустичного поля в оточенні, які допомагають здійснити невізуальну взаємодію між людиною та машиною.

Прогрес:

• Покращення точності технології локалізації джерела звуку;

• Робастна технологія голосової взаємодії в умовах шумового середовища.

Застосування:

• Смарт-дом: голосовое управление устройствами без необходимости физического контакта для выполнения задачи.

• Технологія для інвалідів: забезпечення осіб з вадами зору інтерактивним способом на основі звуку.

3.змішана реальність фізична взаємодія

Концепція: змішування віртуальної інформації з фізичним світом за допомогою технології змішаної реальності (MR), користувачі можуть керувати віртуальним середовищем за допомогою реальних об'єктів.

Розвиток:

• Оптимізація взаємодії з віртуальними об'єктами на основі фізичного відчуття;

• Технологія високоточного відображення фізичних-віртуальних об'єктів.

Застосування:

• Навчання та підготовка: навчання в поглибленому середовищі через моделювання реальних ситуацій.

• Промисловий дизайн: використання віртуального прототипу для перевірки продукції.

  1. Переносні взаємодії

Концепція:

За допомогою розумного годинника, пристроїв для моніторингу здоров'я та інших пристроїв для носіння, взаємодія здійснюється за допомогою жестів, дотику або електроніки для шкіри.

Прогрес:

• Покращена чутливість та довговічність датчика шкіри;

• Алгоритм об'єднання багаторазового каналу покращує точність взаємодії.

Додаток:

• Моніторинг здоров'я: відстеження реального часу пульсу, сну та стану руху;

• Розваги: керування віртуальним персонажем за допомогою пристроїв для носіння.

  1. Інтерактивний діалог людина-машин

Концепція:

Дослідження технологій розпізнавання мови, визначення емоцій, синтезу мови тощо, щоб комп'ютер краще розумів та реагував на мовний ввід користувача.

Прогрес:

• Поширення великих мовних моделей (таких як GPT тощо) значно підвищило природність систем розмов.

• Підвищення точності технології розпізнавання емоцій голосу.

Застосування:

• Клієнт-сервісний робот: підтримка багатомовної мовної взаємодії.

• Інтелектуальний асистент: персоналізована відповідь на голосові команди.

Таким чином, ми бачимо багато проектів AI Agent, особливо в сфері Web3, які в основному залишаються на рівні розумного помічника для міжлюдської комунікації, таких як твіти протягом 24 годин, голосовий чат AI з тисячами облич, розмови для коханих і т. д. Але останнім часом ми також спостерігаємо появу поєднання штучного інтелекту з AI у розумних гаджетах, щоб забезпечити інновації в галузі даних про здоров'я тіла, наприклад, кільце (яку саме компанію я не згадую, ви можете знайти самі, це також #Depin 项目+ # AI ланцюг або додаток, які є більш цінними та цікавими, і інвестори також будуть їх більше любити, в кінці кінців, ми інвестували в 2 компанії, апаратне забезпечення + програмне забезпечення + AI, це буде потенційним напрямом!)

  1. Зараз галузь, в яку активно вкладаються технологічні компанії

  2. Розширення способів взаємодії: дослідження нових засобів взаємодії, таких як відчуття запаху та температури, для подальшого підвищення різноманітності багатомодального поєднання.

  3. Оптимізація комбінації багатьох режимів: створення ефективних, гнучких способів комбінування режимів, щоб різні режими могли співпрацювати більш природним чином.

  4. Зменшення розмірів пристрою: розробка більш легкого та енергоефективного пристрою для повсякденного використання.

  5. Розподілений міжпристрійний взаємодія: покращення взаємодії між пристроями для досягнення безшовного багатопристроєвого взаємодії.

  6. Покращення стійкості алгоритмів: особливо в відкритому середовищі, підвищення стабільності та реального часу алгоритмів багатомодального сприйняття та об'єднання.

  7. Інвестиційні сценарії, варті уваги

• Медична реабілітація: за допомогою голосу, зображень та тактильного відгуку допомагає пацієнтам проводити реабілітаційні тренування та психологічне консультування.

• Офісна освіта: надає інтелектуальний офісний помічник та платформу для індивідуальної освіти, що підвищує ефективність та досвід.

• Військова симуляція: поєднання технології розширеної реальності для проведення бойових симуляцій та тактичного навчання.

• Розваги та ігри: створення захоплюючого ігрового та розважального досвіду, посилення взаємодії користувачів з віртуальним середовищем.

У підсумку д-р Лі систематично висвітлив основні технології багатомодального HCI, використовуючи майбутні сценарії застосування AI Agent, і поєднав їх з практичним застосуванням та майбутніми напрямками досліджень для #SOL 链生态的),比如手表,比如吊坠等。这里面的机会比传统只做单一的 #AI, навчання #AIAgent 的投资者指明了方向和投资的逻辑。这篇文章,可以说是2024年必读的AI书籍,让我更清晰地认识到多模态人机交互技术在推动未来智能化生活中的关键作用,揭示了它在开放环境和复杂场景下的巨大潜力。投资未来,才能把握财富!还是那句话:布局 #AI. Це не терпить відкладення!

AGENT-3.22%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити