用AI Agent预测本届世界杯

两年前在论坛发帖《用人工智能ChatGPT预测本届欧洲杯》,一个月周期最终实现了16.29%的模拟收益率。时隔两年,AI已完成从被动响应的统计语言模型向具备自主规划、工具调用与闭环反思能力的智能体(Agent)的进化。

这次,我准备用Agent驱动的量化预测系统来模拟本届世界杯。先说一下整体架构:底层采用开源Agent框架 OpenClaw 作为执行环境,核心是 Skill封装 Agent调度,模式:将足球预测的完整工作流封装为可复用的Skill,由Agent作为控制中枢,自主完成任务分解、工具链调用与结果聚合。具体执行链路为:抓取实时数据 → 检索增强生成(RAG) → 计算ELO评分 → 拟合泊松分布 → 运行蒙特卡洛模拟 → 输出概率矩阵。大模型推理部分使用 DeepSeek-V4-Pro API,作为Agent的“决策大脑”。

本次预测将生成结构化的量化模型报告,从ELO差、xG预期、进球分布、模拟置信区间等多个维度,完整呈现支撑预测结果的推理过程与数据依据。

玩法说明:本次模拟初始虚拟本金100000元,单场固定投入1000元,为方便执行,从6月14日凌晨3点卡塔尔VS瑞士那场开始。每场根据Agent输出的量化概率,投注三个单关玩法:胜平负、半全场、总进球。按照投注模型分配资金。赔率按实际竞彩执行,预测失败则本金归零,成功则收益累加。

郑重提醒:AI Agent仅为辅助分析工具,以上为模拟娱乐操作,所有投入均为虚拟本金,请勿模仿用于真实投注。
发表时间 2026-06-12 20:43     最后修改时间 2026-06-14 20:20     来自河南

赞同来自: 亩产3万6千斤 十年磨一剑HZ bmxxf 巴菲猫 gaokui16816888 kino winqueen tcswcch 柏拉图的信众 kenny8更多 »

1

星工厂

赞同来自: KevinLe

真诚请教,直接用agent预测,和用chatbot,也就是聊天框预测有什么本质的区别?用法上有差异吗
2026-06-15 08:09 来自江苏 引用
1

coolstone

赞同来自: KevinLe

请教一下,我想学怎么自己做AI AGENT,哪里有文本的学习资料。上班是不能看视频,看文字资料,老板看到了也不好说什么。
2026-06-15 06:22 来自上海 引用
0

seancai110

赞同来自:

【一个月周期最终实现了16.29%的模拟收益率。】
以正规足彩的返奖率来看,是亏的。。
2026-06-15 05:00 来自广东 引用
3

Doking888

赞同来自: KevinLe 柏拉图的信众 gaokui16816888

@物理学不存在
我记得 以前你是不是也开帖预测过,果然是你,上一次满准的。这次希望更加准确率高。不知道你的算法中有没有考虑过临场盘口的变化。
模型对接的API接口是API-Football,由模型抓取这个上面的数据,会根据盘口赔率变化生成最新的报告,但我一天就发一次,所以我一般会在晚上8点左右把最新这版发到论坛上。
2026-06-14 20:24 来自河南 引用
0

物理学不存在

赞同来自:

我记得 以前你是不是也开帖预测过,果然是你,上一次满准的。这次希望更加准确率高。不知道你的算法中有没有考虑过临场盘口的变化。
2026-06-14 20:02 来自上海 引用
2

Doking888

赞同来自: 亩产3万6千斤 醉歌天涯

6月15日1点德国VS库拉索

模型预测高风险,不投

6月15日4点荷兰VS日本

胜平负:平,赔率3.43,投入420

总进球数:2球,赔率3.2,投入400

比分:1:1,赔率5.5,投入180

6月15日7点科特迪瓦VS厄瓜多尔

胜平负:无

总进球数:2球,赔率2.9,投入700

半全场:胜胜,赔率5.4,投入300

6月15日10点瑞典VS突尼斯

总进球数:1球,赔率3.85,投入1000

以上玩法是基于模型给出的预测与投注结合的产出,模型的赔率数据是基于API-Football,不是基于国内体彩,玩法赔率是基于体彩。
2026-06-14 20:25修改 来自河南 引用
6

Doking888

赞同来自: 柏拉图的信众 醉歌天涯 gaokui16816888 kino 奔魔 dvd8878更多 »

@Doking888
6月14日3点卡塔尔VS瑞士
胜平负:无
总进球数:1球,赔率6.4,投入500
半全场:负负,赔率1.43,投入500
6月14日6点巴西VS摩洛哥
胜平负:胜,赔率1.49,投入334
总进球数:1球,赔率4.3,投入334
半全场:胜胜,赔率2.45,投入332
6月14日9点海地VS苏格兰
胜平负:无
总进球数:1球,赔率6,投入500
半全场:负负,赔率1.88,投入500
6月14日1...
第一回合的比赛结束,只命中了一场,海地VS苏格兰,收入是3940,投入本金是4000,收益是负60。接下来我把预测模型里面加入了投注模型,依据是要求大模型每一场比赛把1000元必须花掉(如果不这样要求,模型会根据基于矛盾检查和EV过滤直接阻止结果),模型会根据胜平负,总进球,比分,半全场四种玩法选出最有信心的选项,信心度=模型概率/市场隐含概率,然后会按照信息度加权分配1000元,出来的结果有可能并不是概率最大的那个,而是模型认为最优的那个。

Agent需要回测更新进化升级,所以大家理性看待。
2026-06-14 14:24 来自河南 引用
0

比企能员

赞同来自:

3错3宣告失败
2026-06-14 09:15 来自江苏 引用
1

athus

赞同来自: kolanta

@Doking888
6月14日3点卡塔尔VS瑞士
胜平负:无
总进球数:1球,赔率6.4,投入500
半全场:负负,赔率1.43,投入500
6月14日6点巴西VS摩洛哥
胜平负:胜,赔率1.49,投入334
总进球数:1球,赔率4.3,投入334
半全场:胜胜,赔率2.45,投入332
6月14日9点海地VS苏格兰
胜平负:无
总进球数:1球,赔率6,投入500
半全场:负负,赔率1.88,投入500
6月14日1...
巴西VS摩洛哥 全场1比1
胜平负 结果:平 亏334
总进球 结果:2球 亏334
半全场 结果: 平平 亏332
3错3,错误率100%,总计亏1000.
2026-06-14 08:38 来自上海 引用
0

巴菲猫

赞同来自:

快剧透一下预测谁是冠军
2026-06-13 23:49 来自广东 引用
1

奔魔

赞同来自: KevinLe

@Doking888
因为竞猜赔率本身已包含“抽水”,如果严格按凯利公式推导EV为正的玩法,没几场能投,也有一种办法是通过胜平负、总进球和半全场组合EV>0,是需要通过概率分布和蒙特卡洛模拟,计算组合EV,我刚用模型预测了一下,类似于世界杯这样的比赛,EV>0的独立事件或组合事件概率不足5%,因为需要同时击败市场和抽水,所以这个时候只能平和的接受概率,以学习为主
只是为了评价ai或者说系统的话,不需要一定ev>0,如果用收益来评价的话,那追求ev最大化即可,亏得少也可以判定为好(毕竟是做慈善支持体育事业)。
我是觉得无论是ai还是投资还是什么,首先要确定的是衡量标准或者叫评价指标。比如说告诉围棋ai赢得目数越多越好要大胜要中盘胜,与只要确保赢棋就行要胜率高,两种不同的评价标准发展出的ai行棋风格必然不同。
投资也一样,追求年化10%的与30%、100%的目标不一样,ai给你制定的方案也就会大相径庭。
这个体育竞猜用准确率做评价标准也可以,我觉得需要有更多的对比标准,像前面我回复一个正反馈的问题提过的——这个ai系统也需要正反馈,周期越短越好。
比如巴西对中国,预测巴西胜,结果巴西是胜了,你无法因为这个结果就称赞它猜的准,也无法根据这次预测对它自身做出更多的提升。
比如预测战术体系,控球率,攻防节奏,意志力表现等等。
大概是这样吧,我说的比乱,想到哪说到哪。
2026-06-13 22:33 来自辽宁 引用
1

Doking888

赞同来自: gaokui16816888

奔魔朋友提出来的建议,也是目前世界杯比赛中最现实的的问题,因为竞彩的抽水是这场负和游戏的根源,模型的准确率基本不可能高到覆盖抽水,如果每场都投,意味着无法规避坏局,如果只投正EV,面临没几场能投,所以大家要平和的看待,这只是个测试Agent的游戏,只不过我们给它赋加了赔率。
2026-06-14 14:32修改 来自河南 引用
1

Doking888

赞同来自: gaokui16816888

@奔魔
按概率的话,因为竞猜返奖率的问题,有可能猜的准也还是亏的。
不管是用模拟竞彩的最终盈利金额还是最终正确率来衡量模型预测的好坏都有问题。
前者举例比如胜的概率51%赔率1.6,败的概率40%赔率2.8,选概率高的胜这样玩几十把后就该赔的稀里哗啦了。
后者举例比如都是强弱悬殊的,给出更高概率的预测都是强队一方胜,那最后统计模型准确率60%这到底是算模型好还是不好呢,缺乏判断标准。
我的建议是在事先就想...
因为竞猜赔率本身已包含“抽水”,如果严格推导EV为正的玩法,然后按照凯利公式计算应该投注的资金,没几场能投,也有一种办法是通过胜平负、总进球和半全场组合EV>0,是需要通过概率分布和蒙特卡洛模拟,计算组合EV,我刚用模型预测了一下,类似于世界杯这样的比赛,EV>0的独立事件或组合事件概率不足5%,因为需要同时击败市场和抽水,所以这个时候只能平和的接受概率,以学习为主
2026-06-13 22:05修改 来自河南 引用
0

奔魔

赞同来自:

@Doking888
最高概率,模型类似于「单场扔一次骰子,几点最常出现」,博彩公司看的是「骰子落在哪一带概率密度最大」。两者指向不同方向时,数学上完全合理
按概率的话,因为竞猜返奖率的问题,有可能猜的准也还是亏的。
不管是用模拟竞彩的最终盈利金额还是最终正确率来衡量模型预测的好坏都有问题。
前者举例比如胜的概率51%赔率1.6,败的概率40%赔率2.8,选概率高的胜这样玩几十把后就该赔的稀里哗啦了。
后者举例比如都是强弱悬殊的,给出更高概率的预测都是强队一方胜,那最后统计模型准确率60%这到底是算模型好还是不好呢,缺乏判断标准。

我的建议是在事先就想好结束时用来衡量该智能的标准,告诉该智能,让它自己分析并优化。
2026-06-13 21:24 来自辽宁 引用
0

Doking888

赞同来自:

@奔魔
没有学习前两次大赛的资料吗?前一次欧洲杯和世界杯前的友谊赛数据对正赛的借鉴作用有多大。一般友谊赛对象会找跟小组赛相似的对手,对不同的对手的友谊赛战绩中只有一两个是对当前对手有较大借鉴作用的。
已经维护一个 tournament_db.json,模型现在正在加,感谢提出建议
2026-06-13 21:01修改 来自河南 引用
0

Doking888

赞同来自:

@奔魔
请问给出的结果是最高概率还是最高期望值?
最高概率,模型类似于「单场扔一次骰子,几点最常出现」,博彩公司看的是「骰子落在哪一带概率密度最大」。两者指向不同方向时,数学上完全合理
2026-06-13 20:57 来自河南 引用
0

奔魔

赞同来自:

@Doking888
第一张图片是模型生成的报告,因为图片比较长,以后每个报告就不单独展示了第二张图片是我个人对卡塔尔对战瑞士的预测中,预测总进球只有1球的疑惑,图片中是答案。前期模型还在自我学习,可借鉴意义只能等待验证。
没有学习前两次大赛的资料吗?前一次欧洲杯和世界杯前的友谊赛数据对正赛的借鉴作用有多大。一般友谊赛对象会找跟小组赛相似的对手,对不同的对手的友谊赛战绩中只有一两个是对当前对手有较大借鉴作用的。
2026-06-13 20:44 来自辽宁 引用
0

奔魔

赞同来自:

请问给出的结果是最高概率还是最高期望值?
2026-06-13 20:39 来自辽宁 引用
2

Doking888

赞同来自: gaokui16816888 柏拉图的信众

第一张图片是模型生成的报告,因为图片比较长,以后每个报告就不单独展示了

第二张图片是我个人对卡塔尔对战瑞士的预测中,预测总进球只有1球的疑惑,图片中是答案。

前期模型还在自我学习,可借鉴意义只能等待验证。
2026-06-13 20:15修改 来自河南 引用
3

Doking888

赞同来自: gaokui16816888 kino kolanta

6月14日3点卡塔尔VS瑞士

胜平负:无

总进球数:1球,赔率6.4,投入500

半全场:负负,赔率1.43,投入500

6月14日6点巴西VS摩洛哥

胜平负:胜,赔率1.49,投入334

总进球数:1球,赔率4.3,投入334

半全场:胜胜,赔率2.45,投入332

6月14日9点海地VS苏格兰

胜平负:无

总进球数:1球,赔率6,投入500

半全场:负负,赔率1.88,投入500

6月14日12点澳大利亚VS土耳其

胜平负:负,赔率1.5,投入334

总进球数:1球,赔率4.8,投入334

半全场:负负,赔率2.35,投入332
2026-06-13 19:54 来自河南 引用
0

右冷禅

赞同来自:

我正好对PANKOU 和赔LV有研究
2026-06-13 19:30 来自江西 引用
1

愤怒的牧羊人

赞同来自: KevinLe

不是有新闻说千问昨天预测的全对,连几比几都对了,另外千问加入了足球预测,喂了海量的数据,可以试试
2026-06-13 18:34 来自湖北 引用
0

tigerhu12399 - 称重机而非投票机

赞同来自:

很好,最近在学习如何写skill,不知道楼主可否可以分享一下skill.md模板,供娱乐使用
2026-06-13 16:58 来自广东 引用
0

争取五十岁退休

赞同来自:

必须顶一个,自己也在弄agent在预测,前两天这几场预测的都很准
2026-06-13 16:22 来自浙江 引用
0

混江龙DDD

赞同来自:

楼主今晚的发吗
2026-06-13 14:42 来自河南 引用
0

混江龙DDD

赞同来自:

看看agent的能力
2026-06-13 03:53 来自河南 引用

要回复问题请先登录注册

发起人

问题状态

  • 最新活动: 2026-06-15 08:09
  • 浏览: 2672
  • 关注: 51