ChainOpera AI 与普林斯顿AI实验室合作推出CryptoBench:加密行业首个专家级动态基准测试

image

Source: CryptoNewsNet Original Title: ChainOpera AI Collaborates with Princeton AI Lab to Launch First Crypto-native Benchmark Original Link: https://cryptonews.net/news/blockchain/32117341/

主要亮点

  • ChainOpera宣布与普林斯顿AI实验室合作,推出CryptoBench,这是加密货币行业首个专家级动态基准
  • 该项目由机器学习专家王萌迪教授和博士生谷嘉诚共同开发
  • 该基准将通过在主要DeFi平台上使用精细化代理,提高AI工具在波动市场中的预测准确性

介绍

12月10日,ChainOpera AI公布了其与普林斯顿AI实验室的最新合作,推出CryptoBench,这是加密行业首个专家级动态基准。

它被认为是全球首个专门为测试加密货币行业中AI代理设计的专家级动态基准。

该工具旨在解决主要问题,包括缺乏评估逐渐用于交易、分析和风险评估的大型语言模型的标准方法。

该项目由机器学习专家王萌迪教授和博士生谷嘉诚共同开发。不同于使用旧的静态数据的传统基准,CryptoBench实时运行。

它从区块链获取实时信息,以挑战AI代理。这些测试重点关注四个关键领域,确保在加密市场中有效导航:

  • 从区块浏览器等来源实时获取数据
  • 在高波动性环境中预测未来市场趋势
  • 分析链上数据以发现异常交易模式
  • 风险评估能力

填补安全AI工具的关键空白

CryptoBench的目的是将真正有能力的AI与无效甚至危险的炒作区分开来。

现有的代理基准未能涵盖合成链上情报、市场数据、DEX流动性和MEV警报的需求。CryptoBench每月提供50个行业内真实的问题,分类为简单/复杂检索和简单/复杂预测,反映专业分析师的工作量。

“我们推出CryptoBench,这是一个实时基准,用于在时间敏感、对抗性强的加密工作流程中压力测试LLM代理。现有的代理基准未能涵盖合成链上情报、市场数据、DEX流动性和MEV警报的需求。CryptoBench每月提供50个行业内真实的问题,分类为简单/复杂检索和简单/复杂预测,反映专业分析师的工作量,”官方公告如是说。

对十个最先进的大型语言模型(LLM)的评估显示出明显的检索-预测不平衡:在事实查找方面表现出色的模型,预测推理能力却常常崩溃。代理协作可以重新排列排行榜位置,证明纯模型能力并不等同于实际应用表现。

CryptoBench如何帮助加密行业

2025年,加密行业面临重大安全挑战。预防诈骗和黑客攻击对于行业发展和保障用户安全至关重要。

CryptoBench的DeFi风险评估将提供AI代理能力,实时发现智能合约漏洞和可疑链上活动。

通过基准测试标准的AI代理若能通过,将可以集成到交易所中,在用户交互前自动发出钓鱼合约或潜在“拉盘”的警报。

这一发展将帮助去中心化金融建立所需的信任,从而促进机构采纳,如新加坡市场的例子所示,AI安全已吸引大量去中心化金融投资。

除了安全性,ChainOpera的系统还通过其“智能证明”模型激励贡献者,奖励改善生态系统的努力。

CryptoBench预计将提升AI工具在波动市场中的预测准确率。其基准测试将帮助用户开发更精细的代理,应用于主要的DeFi平台。

例如,AI优化的收益农业已通过预测流动性管理,降低了交易成本,取得了显著成效。

CryptoBench还将提供明确的合规路径。新的法规,比如欧盟的AI法案及未来的指导方针,预计将要求对金融领域中的AI代理进行风险审计。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)