适合每个大模型初学者人手一本的(LLM)大语言模型综述,爆火全网!(附PDF) 2024-07-02 pdf, 语言模型, 人工智能, 自然语言处理 163人 已看 今天给大家推荐一本大模型(LLM)这块的一本外文书,经过整理已经出中文版了,就是这本《大型语言模型综述》!本书在git上有9.2k star,还是很不错的一本大模型方面的书。
评估大型语言模型生成文章的能力 2024-06-27 语言模型, 人工智能, 自然语言处理 131人 已看 1. AI解读1.1. 总体概要本文探讨了大型语言模型(LLMs)如GPT-4在生成特定领域(如计算机科学中的自然语言处理NLP)教育调查文章方面的能力和局限性。研究发现,尽管GPT-4能够根据特定指导生成高质量的调查文章,与人类专家的作品相媲美,但在细节完整性和事实准确性方面仍存在不足。此外,GPT-4在评估机器生成文本时显示出对自身生成内容的偏好,表明在某些情况下,它可能不是人类判断的完美替代品。文章强调了LLMs在教育领域中的潜在变革作用,同时也指出了需要进一步验证和人工干预的必要性,
使用Hugging Face获取BERT预训练模型 2024-06-25 深度学习, 人工智能, 自然语言处理, bert 102人 已看 BERT是一个预训练模型,其基本架构和存档都有相应的服务公司提供下载服务,而Hugging Face是一家目前专门免费提供自然语言处理预训练模型的公司。Hugging Face是一家总部位于纽约的聊天机器人初创服务商,开发的应用在青少年中颇受欢迎,相比于其他公司,Hugging Face更加注重产品带来的情感以及环境因素。在GitHub上开源的自然语言处理、预训练模型库Transformers提供了NLP领域大量优秀的预训练语言模型和调用框架。(1) 安装依赖。
【语言模型】Xinference的部署过程 2024-06-28 语言模型, 人工智能, 自然语言处理 108人 已看 根据自己的需求构建自定义的Xinference Docker镜像,包括安装特定的依赖项、配置环境变量等。这有助于你更灵活地部署和管理Xinference服务。扩展API接口:如果你需要实现自定义的API接口或扩展现有接口的功能,你可以使用Xinference提供的Python SDK或RESTful API接口进行开发。这允许你根据自己的业务需求定制服务的功能和性能。
自然语言处理(NLP)技术。 2024-06-25 人工智能, 自然语言处理 75人 已看 尽管面临挑战,但随着技术的不断进步,包括更强大的计算能力、更丰富的数据资源以及更先进的算法模型,NLP 技术无疑将继续取得突破。自然语言处理技术是一项具有深远影响的技术,它不仅改变了我们获取和处理信息的方式,也为人类与计算机之间的交互开辟了新的可能性。在文本分类和情感分析中,NLP 技术可以自动对大量文本进行分类和标注,例如将新闻文章分类为不同的主题,或者分析消费者对产品的评价情感是积极还是消极。5. 情感分析:NLP技术可以分析文本中的情感倾向,判断文章或评论的情感是积极的、消极的还是中性的。
本地部署Ollama+qwen本地大语言模型Web交互界面 2024-06-18 语言模型, 交互, 人工智能, 前端, 自然语言处理 95人 已看 Ollama WebUI 已经更名为 Open WebUI.Open WebUI是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线操作。它支持各种 LLM 运行程序,包括 Ollama 和 OpenAI 兼容的 API。Ollama WebUI 是一个革命性的 LLM 本地部署框架,具有类似 ChatGPT 的 Web 界面。让我们为您的 Ollama 部署的 LLM 提供类似 ChatGPT Web UI 的界面,只需按照以下 5 个步骤开始行动吧。
自然语言处理(NLP)的最新突破和应用 2024-06-17 人工智能, 自然语言处理 73人 已看 例如,Google Translate和Microsoft Translator等翻译工具广泛应用于日常交流、商业合作和学术研究中,极大地方便了不同语言之间的沟通【9†source】【8†source】。例如,银行、保险公司和电商平台普遍采用智能客服,减少人工客服的工作量,提高服务效率【9†source】【8†source】。这些模型通过在大量多语言语料上进行训练,掌握了不同语言之间的通用语义表示,能够在不同语言环境中实现高效的文本处理和理解【9†source】。
2024-06-21 问AI: 在大语言模型中,什么是LLama Index 2024-06-21 llama, 语言模型, 人工智能, 自然语言处理 96人 已看 从某个时间点开始,LLama Index不仅限于文本处理,还扩展到了支持大语言模型的多模态处理功能,意味着它可以处理包括图像、音频在内的多种类型的数据,进一步扩展了模型的应用范围。:作为数据与LLMs之间的接口,LLama Index帮助构建高效的查询机制,使得用户可以通过自然语言提出问题,系统则能有效地从整合的数据中检索相关信息,并通过大语言模型生成响应。综上所述,LLama Index是一个强大的工具,它通过促进数据与语言模型的有效互动,提高了大语言模型在实际应用场景中的实用性和智能水平。
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs 2024-06-23 语言模型, 人工智能, 自然语言处理 85人 已看 虽然现如今大模型展现出无与伦比的表现,但是其在工具理解和使用方面依然存在不足,即根据用户的指令和意图来使用外部API。这是因为现有的指令微调任务大多数是基于语言任务,而忽略了工具的调用指令。因此,本文希望为开源的大模型探索一个可以使用工具的模型,并提出TooLLM。
自然语言处理NLP概述 2024-06-19 人工智能, 自然语言处理 81人 已看 自然语言处理(Natural Language Processing,简称NLP)是计算机科学、人工智能和语言学领域的一个分支,主要研究人类语言和计算机之间的相互作用。总之,自然语言处理在过去的几十年中取得了巨大的进展,推动了许多实际应用的实现。- 神经网络语言模型:使用神经网络来预测词的概率分布,如Word2Vec、GloVe和BERT。3. 对话系统和聊天机器人:构建能够与人类进行对话的系统,如客服机器人和智能助理。- 统计语言模型:基于大规模文本数据计算词的共现概率,如n-gram模型。
摩根大通研究论文:大型语言模型+自动规划器用来作有保障的旅行规划 2024-06-17 语言模型, 人工智能, 自然语言处理 101人 已看 本文提出了一种结合大语言模型(LLM)和自动规划器的混合方法TRIP-PAL用于旅行规划。实验主要对比了GPT-4和TRIP-PAL在不同规模的一日游规划任务上生成的旅行规划的质量。本论文针对旅行规划问题,提出了一种结合大语言模型(LLM)和自动规划器(automated planner)的混合方法TRIP-PAL。该方法利用LLM从用户需求中提取相关的旅行信息,并将其转化为规划器可接受的形式。之后,规划器在满足各种约束条件的前提下,生成最大化用户效用的最优旅行计划。
NLP之实体抽取 2024-06-19 人工智能, 自然语言处理 75人 已看 实体抽取(Entity Extraction)是自然语言处理(NLP)领域中一项重要的技术,它的目的是从非结构化的文本数据中识别并提取出有意义的实体。实体是指文本中表示某种具体事物的词语或短语,通常包括以下几类:人名:如"马云"、“比尔·盖茨”地名:如"北京"、“纽约”组织机构:如"阿里巴巴"、“联合国”日期:如"2024年6月18日"时间:如"下午三点"货币:如"100美元"数量:如"5000平方米"产品:如"iPhone 14"品牌:如"可口可乐"
Amazon 文本数据提取服务-Textract对比Amazon 自然语言处理服务-Comprehend 2024-06-19 人工智能, 自然语言处理 81人 已看 前言在人工智能技术不断进步的当下,自然语言处理(NLP)和机器学习正变得越来越重要。Amazon Web Services(AWS)为我们提供了Amazon Textract 和 Amazon Comprehend这两大服务,帮助我们更好地处理和分析文本数据。本文将对比这两个服务的核心功能、独特特性、响应时间、吞吐量、文档支持等多个方面,旨在帮助开发者和企业技术负责人选择最适合自己项目需求的AWS服务。
ACL2024 | AI的时空穿越记:大型语言模型共时推理的奇幻之旅! 2024-06-19 语言模型, 人工智能, 自然语言处理 76人 已看 作者:苏肇辰标题:Living in the Moment: Can Large Language Models Grasp Co-Temporal Reasoning?录取:ACL2024 Main论文链接:https://arxiv.org/abs/2406.09072代码链接:https://github.com/zhaochen0110/Cotempqa单位:苏州大学、上海人工智能实验室????...
深度神经网络——什么是NLP(自然语言处理)? 2024-06-17 dnn, 深度学习, 人工智能, 自然语言处理, 神经网络 83人 已看 NLP 是一个跨学科领域,它结合了语言学和计算机科学等领域已建立的技术。这些技术与人工智能结合使用来创建聊天机器人和数字助理,例如 Google Assistant 和亚马逊的 Alexa。让我们花一些时间来探讨自然语言处理背后的基本原理、NLP 中使用的一些技术以及 NLP 的一些常见用例。
摩根大通研究论文:大型语言模型+自动规划器用来作有保障的旅行规划 2024-06-17 语言模型, 人工智能, 自然语言处理 96人 已看 本文提出了一种结合大语言模型(LLM)和自动规划器的混合方法TRIP-PAL用于旅行规划。实验主要对比了GPT-4和TRIP-PAL在不同规模的一日游规划任务上生成的旅行规划的质量。本论文针对旅行规划问题,提出了一种结合大语言模型(LLM)和自动规划器(automated planner)的混合方法TRIP-PAL。该方法利用LLM从用户需求中提取相关的旅行信息,并将其转化为规划器可接受的形式。之后,规划器在满足各种约束条件的前提下,生成最大化用户效用的最优旅行计划。
计算机毕业设计Python+Flask微博舆情分析 微博情感分析 微博爬虫 微博大数据 舆情监控系统 大数据毕业设计 NLP文本分类 机器学习 深度学习 AI 2024-06-19 python, 机器学习, 深度学习, 人工智能, 自然语言处理, flask, 开发语言 87人 已看 计算机毕业设计Python+Flask微博舆情分析 微博情感分析 微博爬虫 微博大数据 舆情监控系统 大数据毕业设计 NLP文本分类 机器学习 深度学习 AI
NLP自然语言处理课程设计—基于实体识别的智能任务系统 2024-06-13 人工智能, 自然语言处理, 课程设计 92人 已看 在人工智能与自然语言处理技术飞速发展的今天,构建一个能够理解和处理自然语言的智能任务系统成为了计算机科学领域的一项重要挑战。本课程设计旨在通过实践教学,深入掌握自然语言处理(NLP)的关键技术和应用,同时培养解决复杂工程问题的能力。本课程设计的核心目标是开发一个能够通过自然语言处理技术,帮助用户高效管理各种任务的系统。系统需要具备任务识别和分类、实体抽取、任务管理以及用户交互等核心功能。为了实现这些功能,我们采用了先进的深度学习模型,如双向长短期记忆网络(BiLSTM)结合条件随机场(CRF),以及。
【Intel CVPR 2024】通过图像扩散模型生成高质量360度场景,只需要一个语言模型 2024-06-12 语言模型, 人工智能, 自然语言处理 80人 已看 在当前人工智能取得突破性进展的时代,从单一输入图像生成全景场景仍是一项关键挑战。大多数现有方法都使用基于扩散的迭代或同步多视角内绘。然而,由于缺乏全局场景布局先验,导致输出结果存在重复对象(如卧室中的多张床),或者每个视图都需要耗时的人工文本输入。我们提出的 L-MAGIC 是一种新型方法,它利用大型语言模型进行引导,同时扩散 360 度全景场景的多个连贯视图。L-MAGIC 利用预先训练好的扩散和语言模型,无需微调,确保零误差性能。超分辨率和多视图融合技术进一步提高了输出质量。