美团的大模型也来了[哆啦A梦吃惊]
LongCat-Flash,总参数量达 560B,采用了创新的动态计算机制 MoE 架构,能根据上下文需求激活 18.6 B 至 31.3 B 的参数(平均约 27B)。
美团的大模型也来了[哆啦A梦吃惊]
LongCat-Flash,总参数量达 560B,采用了创新的动态计算机制 MoE 架构,能根据上下文需求激活 18.6 B 至 31.3 B 的参数(平均约 27B)。
猜你喜欢
【14评论】【5点赞】
【58评论】【23点赞】
【5评论】【1点赞】
【61评论】【47点赞】
【46评论】【21点赞】
作者最新文章
热门分类
科技TOP
科技最新文章