在孔曼子老师横空出品 手把手教你建立自己的集思录发贴回贴知识库(孔曼子)的时候,我在折腾一套基于dify的交易辅助工具。说一说折腾过程。我也在新手阶段,各位有兴趣的可私信,共同探讨。
1. 免费数据:java mysql nginx,日级可转债数据,部分股票数据,部分宽基指数数据,行业板块数据,部分财报数据等,主打一个行情知识库。
2. 开源平台:python dify Milvus,打通行情知识库,爬交易记录,开发工作流等。
3. 花钱部分:云服务器,大模型API。
全局交易分析 (2015年开始)
其实输出的统计量很多,我截取了一部分。如果交易记录能够配合上行情历史数据,那么可以切入更多的角度,这个工程的细节在如何设置提示词,慢慢研究吧。
小广告:
我目前用的三方大模型API是硅基流动,注册可以送token,如果哪位也想折腾一下,可以用这个邀请码,我也可以得到同样数量的token,token这东西看起来很多,用起来如流水,谁用谁知道。
邀请链接:https://cloud.siliconflow.cn/i/DsDW708t
开始
最初的想法和孔曼老师一样,致力于打造一个包罗万象的投资图书馆,我知道有很多开源知识库工具可选,例如dify,ragflow,maxkb,ima等。用过一段时间ima,体验很不错,风格简单干净,召回效率也在线,关键是后台模型免费,小缺点是没有知识库微调功能。如果说我们只是想自建一个投资图书馆,那么故事到这里就完了,ima完全可以满足这个需求。但是知识库停留在过去的数据,例如想要做可转债行数据的查询对比,那么就需要在知识库维护每日行情数据,或者想做一些个人交易行为的特征分析,需要去维护交易记录,这不是知识库的定位。我决定用dify去实现以上需求,dify是一个通用大模型应用开发平台,可以编排工作流开发agent。计划要实现的功能:行情数据分析,交易记录回溯分析,数据可视化,转债多因子策略等。一番操作
说干就干,花了1800软妹币,在腾讯云上租了3年服务器。过去3个月时间,搭平台,写代码,搞测试,爬数据,调工作流。这些活儿又脏又累,而且由于经费有限,服务器性能还不太行,动不动就出点小毛病。其实也没什么可说的,大多数都是数据处理工作,配合dify平台的一些插件,大致架构:1. 免费数据:java mysql nginx,日级可转债数据,部分股票数据,部分宽基指数数据,行业板块数据,部分财报数据等,主打一个行情知识库。
2. 开源平台:python dify Milvus,打通行情知识库,爬交易记录,开发工作流等。
3. 花钱部分:云服务器,大模型API。
成果展示
非常惭愧,最先做的行情数据分析功能,由于模型幻觉问题,常常把数据搞错。比如我提取了锋工转债三个月的数据,我让模型总结某些特征,推荐类似数据特征的转债,它通常有自己的逻辑,输出不稳定。我在尝试新的工作流思路。我想说的是,不废话,图上见,交易记录回溯分析功能:
个股交易分析(2023年开始):
全局交易分析 (2015年开始)
其实输出的统计量很多,我截取了一部分。如果交易记录能够配合上行情历史数据,那么可以切入更多的角度,这个工程的细节在如何设置提示词,慢慢研究吧。
结语
小宇宙上听了一档节目,说是某个FOF公司,可以用ds给基金经理画像,通过其产品表现,以及季度调仓行为,分析其投资风格。我觉得这个事情没有多难,虽然现在有很多账本工具可以做收益分析,到了年终还会给你输出一份投资报告。不同于那些定制的账本,基于大模型的交易记录分析,泛化功能比较强,也可以说它更聪明,深入交易细节,以后结合行情数据,它能给出一份交易路径的建议。小广告:
我目前用的三方大模型API是硅基流动,注册可以送token,如果哪位也想折腾一下,可以用这个邀请码,我也可以得到同样数量的token,token这东西看起来很多,用起来如流水,谁用谁知道。
邀请链接:https://cloud.siliconflow.cn/i/DsDW708t