August 2024

2分钟学点RAG – Embedding嵌入

Embedding是一种将高维数据映射到低维向量空间的技术,用来表示数据的语义或特征信息。简单来说,嵌入是将复杂的对象(如单词、句子、图像等)转化为固定大小的数值向量。视频介绍了Embedding的基本概念,Embedding嵌入向量生成的过程。 2分钟学点RAG -… – @黄建同学 的视频 – 视频 – 微博 (weibo.com)

Read More

视频生成5B模型CogVideo开源了

视频生成5B模型CogVideo开源了!大幅度优化了模型的推理性能,推理门槛大幅降低。#ai##chatgpt# 基于论文:CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer(带有专家 Transformer 的文本到视频扩散模型) 摘要: 我们介绍了 CogVideoX,这是一种大规模扩散Transformer模型,旨在根据文本提示生成视频。 为了有效地对视频数据进行建模,我们建议利用…

Read More

SuperCraft

SuperCraft 通过无限工作流画布将草图直接转换成真实产品图像,并自动生成3D渲染模型。 它提供了一个无限的协作画布,用户可以在上面通过手绘草图或使用文本提示生成草图来开始设计。 地址: https://supercraft.ai/ https://supercraft.ai/supercraft_hero_demo.mp4

Read More

自动视频翻译的 AI 工具:VideoLingo

推荐 GitHub 上开源的一款全自动视频翻译的 AI 工具:VideoLingo。 能够一键全自动对视频进行字幕切割、翻译、精准对齐和个性化配音,最终生成 Netifx 级别的字幕和配音。 GitHub:github.com/Huanshere/VideoLingo 具有如下特点: 使用 NLP 和 LLM 进行字幕分割;…

Read More

Anthropic 罕见的主动公布了 Claude 的系统提示词 并承诺将定期更新

Anthropic 罕见宣布公布了其生成性 AI 模型 Claude 的系统提示,这些提示用来指导模型如何表现以及不该做什么。 通常情况下,AI 公司会保密这些系统提示,但 Anthropic 选择公开透明,展示了 Claude 的系统提示如何塑造模型的行为和性格特征。比如,Claude 被指示要显得聪明、好奇,并在处理争议性话题时保持中立和客观。此外,Claude 被指示不要打开URL链接或识别人脸。 Anthropic…

Read More

掌握Prompt写作技巧:写出完美Prompt的秘籍

Prompt 这是2024年的第61篇文章 ( 本文阅读时间:20分钟 ) 01 引言 大规模语言模型(LLM, Large Language Models)扮演着越来越重要的角色。然而,想要真正发挥这些模型的强大能力,关键在于如何向模型输入明确、详细且符合预期的指令,这就是我们今天要讨论的重中之重——Prompt的写作。 Prompt,作为一种结构化的输入序列,不仅为模型提供任务要求和背景信息,更在很大程度上决定了模型输出的质量与相关性。一个设计优秀的Prompt,能够最大程度地减少误解,使得模型理解用户的需求并生成高质量的响应。 这篇文章的核心宗旨就是教你如何写出优秀的Prompt。我们将从Prompt的定义、运行过程,以及优秀Prompt应具备的各个要素入手,逐步展开详细的解析和实用示例,让你在短时间内掌握写作高效Prompt的技巧和策略。通过不断优化你的Prompt写作能力,你将能够更好地引导大模型,为各类应用场景生成高质量的文本输出。 准备好了吗?让我们一起开启Prompt写作秘笈,解锁大模型的无限可能! 02…

Read More

强烈推荐一个 AI 辅助编程的工具 cursor + deepseek-coder api,实际体验超预期,Github Copilot 已退订 Bingal

cursor 简介 Cursor 是一个以 AI 为核心的代码编辑器,它通过智能自动完成、多行编辑、智能重写等功能来提高软件开发效率,同时提供了与 AI 对话的能力,以帮助开发者理解和操作代码库。 官方网站 cursor 有哪些让人眼前一亮的特性? 多行编辑:Cursor 支持多行编辑,除了可以像其他 ai 插件一样生成代码以外,还可以基于现有代码自动提示可能需要修改的地方,实际使体验非常顺滑,很多时候一路…

Read More

zhangnengwei123vLLM-docker-Qwen2 学习vLLM,使用vLLM部署Qwen2-0.5B的模型,并使用docker部署。

vLLM 学习vLLM,使用vLLM部署Qwen2-0.5B的模型,并使用docker部署。 https://docs.vllm.ai/en/latest/serving/deploying_with_docker.html https://www.modelscope.cn/models/qwen/Qwen2-0.5B-Instruct-GPTQ-Int4 https://github.com/QwenLM/Qwen2?tab=readme-ov-file https://huggingface.co/Qwen/Qwen2-0.5B-Instruct-GPTQ-Int4 环境 python 3.8 cuda 12.5 pytorch #与cuda匹配的版本,这里选择与12.1的cuda匹配 transformers>=4.40.0 安装cuda…

Read More