包含标签 Qwen-7B 的所有文章

  • 阿里云的通义千问(Qwen-7B)大语言模型项目地址

    阿里云研发的通义千问-7B(Qwen-7B)是通义千问大模型系列中规模达到70亿参数的模型。Qwen-7B是基于Transformer的大语言模型,通过在超大规模的预训练数据上进行训练而得到。预训练数据类型广泛,包括网络文本、专业书籍、代码等,覆盖了多个领域的知识。 不仅具备优秀的模型性能,还支持多语言,并具有8K的上下文长度。这意味着它能够更好地理解和处...

    2023-8-4 09:12
    701 2