LlamaIndexLangChain 是两个可助力创建和实施检索增强生成 (RAG) 系统的平台。LlamaIndex 专为简化搜索和检索而构建,而 LangChain 是一个多功能模块化平台,支持众多用例。

RAG 可以为大型语言模型 (LLM) 配备特定领域的知识,以提高聊天机器人和其他人工智能 (AI) 应用程序的准确性和实用性。虽然 LlamaIndex 和 LangChain 的用例存在重叠,但它们各自完成 RAG 系统创建任务的方式有所不同。

LlamaIndex 专注于从基于文本的数据源进行索引、数据摄取信息检索,因此成为了比较简单的工作流和 AI 应用程序的理想之选。相比之下,LangChain 的模块化框架在构建多种自然语言处理 (NLP) 和agentic AI 应用程序方面表现出色。

阅读全文 »

检索增强生成(RAG)是一种通过将人工智能(AI)模型与外部知识库连接来优化其性能的架构。RAG 可帮助大型语言模型 (LLM) 以更高的质量提供更相关的响应。

生成式人工智能(gen AI)模型在大型数据集上进行训练,并参考这些信息生成输出结果。然而,训练数据集是有限的,而且仅限于人工智能开发人员可以访问的信息–公共领域作品、互联网文章、社交媒体内容和其他可公开访问的数据。

RAG 允许人工智能生成模型访问额外的外部知识库,如内部组织数据、学术期刊和专业数据集。通过将相关信息整合到生成过程中,聊天机器人和其他自然语言处理(NLP)工具无需进一步培训就能创建更准确的特定领域内容。

阅读全文 »

Python

安装 Playwright Stealth 插件:

pip install playwright-stealth

打开 index.py 文件,将下面的导入内容添加到 Playwright 脚本中:

from playwright_stealth import stealth_async

或者,如果您使用的是同步 API:

from playwright_stealth import stealth_sync

要在 Playwright 中注册,请将 page 对象传递给导入的函数,如下所示:

await stealth_async(page)

或者,如果您使用的是同步 API:

stealth_async(page)

stealth_async() 功能将通过覆盖某些默认配置来扩展 page 功能,以避免僵尸检测。

JS

首先,安装 playwright-extrapuppeteer-extra-plugin-stealth

npm install playwright-extra puppeteer-extra-plugin-stealth

接下来,从 playwright-extra 导入 chromium 而不是 playwright ,从 puppeteer-extra-plugin-stealth 导入 StealthPlugin

import { chromium } from "playwright-extra"
import StealthPlugin from "puppeteer-extra-plugin-stealth"

然后,用以下方式注册隐身插件:

chromium.use(StealthPlugin())

把这一切放在一起,你就会得到:

import { chromium } from "playwright-extra"
import StealthPlugin from "puppeteer-extra-plugin-stealth"

(async () => {
// configure the Stealth plugin
chromium.use(StealthPlugin())

// set up the browser and launch it
const browser = await chromium.launch()
// open a new blank page
const page = await browser.newPage()

// navigate the page to the target page
await page.goto("https://arh.antoinevastel.com/bots/areyouheadless")

// extract the message contained on the page
const messageElement = page.locator('#res')
const message = await messageElement.textContent()

// print the resulting message
console.log(`The result is: "${message}"`)

// close the browser and release its resources
await browser.close()
})()

参考