快讯:阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash。该模型面向实时Agent工作流场景,最高推理速度可达每秒350个token。
据悉,Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数)
截至目前,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已完成适配!
快讯:阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash。该模型面向实时Agent工作流场景,最高推理速度可达每秒350个token。
据悉,Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数)
截至目前,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已完成适配!
作者最新文章
热门分类
社会TOP
社会最新文章