虽然让热切的用户能够轻松获得模型是一件很棒的事情,但模型 更好的模型发现 搜索和 的选择越多,就越难找到真正适合下一个项目的模型。想想过去几年中,公开可用的 NLP 模型数量激增TensorFlow,PyTorch, 和拥抱脸社区。例如,Hugging Face 允许任何人免费上传模型,现在有 3,000 多个模型可供选择。这使得找到最符合你需求的模型变得非常困难。
模型中心正在快速改进
以帮助用户正确完成此操作——提供更好的分面搜索、精心策划的 WhatsApp 号码数据 “最受欢迎”和“最高评价”建议以及更智能的搜索结果排名。Spark 自然语言处理模型中心采用了不同的方法,限制社区上传,但为所有已发布的模型提供官方支持,作为库的一部分。这意味 帮助您快速解锁 Instagram 帐户的说明* 着每个 NLP 任务的模型和管道都会定期更新,当出现更好的最新算法、模型或嵌入时会定期更换,并且授权客户在遇到问题时可以依赖企业支持。
NLP 走向多语言
从历史上看,最高质量的 NLP 软件是为英语开发的,然后是 工具来 线数据库 让团 为普通话开发的。现在,像谷歌和 Facebook 这样的公司正在发布预先训练150 多种语言的嵌入都是免费和开源的。NLP 库也在效仿。以 Spark NLP 为例,它现在提供 46 种语言的模型。这种级别的多语言支持在几年前是闻所未闻的,因此这是包容性和多样性的一大进步,将 NLP 交到全球数据科学家手中。