What I’m learning

最近一段时间 AI 领域有几个比较重要的更新:

  • claude 发布 sonnet 3.7
  • deepseek 发布推理模型 R1
  • openai 发布 gpt 4.5 , google 发布 gemini 2.0 , xai 发布 grok3

从我个人使用体验来看,

  • claude sonnet 在编程领域遥遥领先,3.7 进一步巩固了优势
  • deepseek R1 是性价比极高的开源推理模型,但是仍然需要优质的数据源,我常用的是 perplexity 部署的版本 perplexity-reasoning , 效果不错
  • grok3 有推特数据 , gemini 有 google 数据 , 针对特定问题效果非常好 , 最好的方式还是用类似 monica 的客户端同时获取多个 LLM 的回答

另外一个大多数人没注意到的领域是 MCP server 开始爆发, MCP server 是 anthropic 去年推出的一套协议, 其主要目的是让大语言模型能够从外部获取数据并使用工具。 以下是一些我觉得比较有用的 MCP server:

  • browser-tools: LLM 能使用浏览器 , 浏览网页 , 获取 console log
  • brave-search: LLM 能获取搜索引擎的聚合数据
  • github : LLM 能提交代码到 github , 提交 pull request
  • 更多的MCP server 可参考 https://github.com/modelcontextprotocol/servers 人和猿猴的区别主要在于是否能够使用工具 , 我认为能使用工具和获取外部数据的 LLM agent 也会远强于不会使用工具的裸体 LLM。

What I’m buying

最近市场比较动荡, $btc 从 10 万 u 左右回调至 8万 u , 背后的原因可能有短期买入资金衰竭,地缘政治形势紧张等等 ,我仓位持有绝大部分 usdt 躲过这次调整,但是还是在一些山寨币上犯了不该犯的错误,做一个简单的复盘:

$solv: 在币安上线时买入,一天时间跌了 40% 后卖出。(卖盘主要来自空投)

$alon: pump.fun 创始人代币 , 买入后半天跌了 80% 后卖出。(卖盘主要来自于低位埋伏的大量筹码)

$cheems: 上线币安后买入 , 半天时间跌了 40% 后卖出 (卖盘主要来自于 BSC 链上老鼠仓)

$libra: 阿根廷总统米莱推出的代币 , 发布一小时后 dev 撤池子 rug , 1 小时跌 80%。 (卖盘主要来自于 dev)

在金融市场中不犯错误是不可能的,因为不出手永远不可能赢。但是在犯错误的时候,必须做到以下两点:

  1. 做好仓位管理,避免大比例损失。5% 的亏损,只需要5.2%的盈利就能弥补 ; 但是 50% 的亏损,需要 100% 的盈利才能弥补。
  2. 认真复盘,从错误中学习,之后不再犯类似错误,甚至能利用其他人犯的类似错误。

虽然市场在下跌趋势中,但一些机会已经开始孕育,比如我最近发现 crypto 市场中也有 short squeeze (轧空) 的机会。

比如观察 $alch 的期货数据,可以发现:

  • $alch 的期货合约持仓量, 超过了它的现货市值
  • $alch 的空头平均成本非常低 (30M 以下) 在这样的情况下,空头作为整体是非常脆弱的, 因为他们在低位开出了过大的仓位,这将使它们处于极为不利的情况:如果价格向上拉升,它们将不得不减仓或者被强制减仓,而减仓时的平空单(多单)将让价格继续向上运行,让其他空头处于更加不利的状况,最终的状况是空头像多米诺骨牌一样崩溃,而价格则攀升到一个荒谬的地步。

What I’m training

上周天去参加了仁寿的半马比赛,结果跑到 10 公里的时候岔气了,肚子剧痛,只能慢跑+走路完成后半程的比赛, 最终 1 小时 47 分钟完赛。 虽然比赛跑崩了,不过我很快就坦然接受了这个结果,因为在冬季恶劣的天气状况下,我仍然努力保持较高频率的训练,并且在训练中刷新了自己 5 公里的最好成绩。对我来说,过程比结果更重要,Do your best and let God do the rest。

从本次比赛我学到了如下经验:

  • 如何避免岔气?
    • 高强度运动前不能吃难以消化的高脂肪,高纤维食物
    • 长距离跑步最优策略是前慢后快,避免前面冲太猛
    • 重视基础核心训练(侧向平板+举腿,核心抗旋,单腿臀桥等)和呼吸训练