Aetheris 研究小组致力于解决人工智能中的对齐问题与大规模稀疏架构演进。
探索如何通过新型梯度估算算法在异构计算集群上提升强化学习的训练收敛速度。
一种全新的混合架构,使得大型语言模型在处理复杂逻辑推理任务时具有更高的可解释性。
通过动态稀疏技术,将注意力机制的复杂度从平方级降低至线性级。
我们的团队在温哥华分享了关于安全对齐的最新思考,并与同行探讨了 AGI 的演进路径...
为了支持更大规模的分布式任务,我们完成了上千颗顶级算力芯片的部署与网络优化...