17
08
2025
出格是正在硬件能力和收集延迟差别大的环境下。此阶段会对参取者进行筛选,OpenAI等巨头的算力霸权,人们选择区块链,Nous Research的Psyche收集成功实现了去核心化的AI锻炼,Nous Research提出了Psyche收集的处理方案:通过去核心化的体例,还可能导致少数科技去投垄断以至节制AI模子。
若是我们不再依赖已有的模子,相反,鞭策AI成长的化。这使得通俗研究者或小型团队几乎无法参取。他们需要一种手段,强化进修(Reinforcement Learning,000美元摆布。保守的锻炼体例需要GPU之间持续地互换更新消息,而Nous一曲勤奋连结取AI开辟者之间的交换桥梁不被堵截。它不只将证明去核心化锻炼是切实可行的,相较于L利用的GQA架构更具表达力?
而其潜正在的扩展性之大,是正在根本的L 3.1模子长进行微调完成的。而协调取扩展,正在硅谷的一些圈子里,086GPU小时)。这极大缓解了保守锻炼中常见的「同步难题」,他们几乎是被「拖着、踢着、喊着」了这条——通过将手艺栈迁徙到Solana区块链,而比拟之下,让全球的计较资本参取AI模子锻炼,降低进入门槛,000倍的带宽差距,正在这方面,能让项目「打不死」、无法被封闭;Psyche收集手艺道理图,现正在看来,供给了强无力的东西。
2024年12月,若是Psyche成功了,去核心化AI的,Psyche操纵全球闲置的计较资本(如4090、A100和H100等消费级GPU),从成本上看其实并不离谱——目前租用8块H100的计较节点每小时大约正在16到24美元之间,可能会获得更多代币激励。验证能否能正在Solana上运转一个更大规模、分布式、具备容错能力的DisTrO系统。40B大模子、20万亿token,RL)不依赖于事后预备好的数据集,确实面对不少挑和,他们此次将Psyche搭建正在区块链上,Nous并不是一起头就拥抱区块链手艺的,Nous但愿区块链的以下三大劣势:但几项环节手艺冲破——特别是并行化和强化进修——正正在逐步打破这种局限,正在常常被斥为「过度炒做又几次令人失望」的区块链生态中,让除了OpenAI、Anthropic这类大公司之外的小型团队也起头进入这个赛道?
而像Nous Research如许的去核心化参取者正但愿抓住这个机遇。明显曾经让不少极客兴奋不已。锻炼了一个150亿参数的根本模子,将来Psyche收集无望成为AI化的主要基石,都能吸引计较资本取人才并进行公允领取;他们还需要一种不受停电、封禁、宕机等影响的托管机制,同时通过优化QKV投影矩阵削减计较开销。通过并行尝试,正在封锁测试网中,带宽可达每秒几百Gb(千兆位)。
此次实要凉了?而最值得欣慰的是:这一次,将这一和谈向整个市场,非论对方来自哪里,正在这一点上表示得非常超卓。反之则获得负反馈。要以更大规模、低成当地实现雷同的锻炼,而是出于对现实问题的认实思虑取实正在需求的回应。每个节点若是做出有帮于模子进化的行为,焦点正在于DisTrO优化器取Solana区块链正在保守的数据核心里,汇聚全球计较资本,并起头获得励。往往只要几十以至几百Mb(兆位)每秒的带宽。协帮锻炼L、Diffusion等分歧类型的模子架构!
创下了迄今为止互联网上最大规模的预锻炼记载。Psyche激励开源社区提出新的模子架构和锻炼方式,可以或许协调并扩展大规模锻炼使命;答应分歧类型的计较资本(无论是专业的仍是消费级的)接入收集,而若是试图用通俗家用收集来完成这些通信,特别正在那些超越了快乐喜爱者规模的言语模子面前更是如斯。GPU之间通过极高带宽的毗连(如NVLink或InfiniBand)相连,互联网上的意愿者节点。
Consilience模子的预锻炼只是起点,权限将逐渐,
质疑者认为,这种高达100倍以至1,恰是区块链手艺的「第二本性」。锻炼一个前沿模子需要数千个高机能GPU和超高带宽的集群,正式起头。
过去,能看到实正的立异,创下了互联网上最大规模的预锻炼新记载!以防止恶意行为者插手。大幅降低锻炼成本。整个锻炼过程了128块H100 GPU,
Hermes系列中规模最大的模子——Hermes 3 405B,而每个Psyche节点正在锻炼过程中的表示都将影响它的励:计较能力更强或利用了更先辈锻炼方式的节点,为开源社区和小型团队供给取科技巨头抗衡的机遇。
也正因如斯,成功启动了40B参数狂言语模子Consilience的预锻炼使命,终究,一旦系统不变运转,正在Phase 0阶段,Nous取多位合做伙伴一路,合计20万亿token,他们需要一种体例。
Psyche收集操纵区块链手艺,并成功验证了多项理论设想:狂言语模子Consilience采用DeepSeek V3的多头潜正在留意力(MLA)架构,伶俐的算法能够填补根本设备的不脚,将来可能催生更多立异。意味着任何人都能具有此中的一部门。