Skip to content

Commit 5e02602

Browse files
authored
✨ feat: support web page crawl in the search (#6582)
* test pnpm workspace * test bun workspace * add crawler mode * improve pure fetch result * update * improve result * improve code * update * fix * 完成 urlRules 规则集合设计 * 增加爬虫展示 ui * 增加爬虫展示 Portal * update * update * improve * update i18n * support view multi pages * improve implement * improve code * refactor the web-browsing system prompt * improve code * fix open
1 parent 8bf1b90 commit 5e02602

File tree

96 files changed

+4738
-249
lines changed

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.

96 files changed

+4738
-249
lines changed

locales/ar/models.json

+9-3
Original file line numberDiff line numberDiff line change
@@ -467,9 +467,6 @@
467467
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
468468
"description": "لقد رفع كلود 3.5 سونيت معايير الصناعة، حيث تفوق أداؤه على نماذج المنافسين ونموذج كلود 3 أوبس، وأظهر أداءً ممتازًا في تقييمات واسعة، مع الحفاظ على سرعة وتكلفة نماذجنا المتوسطة."
469469
},
470-
"anthropic.claude-3-7-sonnet-20250219-v1:0": {
471-
"description": "Claude 3.7 Sonnet هو أحدث نموذج من Anthropic، يتميز بأداء ممتاز في تقييمات واسعة، ويتفوق على نماذج المنافسين ونموذج Claude 3.5 Sonnet، مع الحفاظ على سرعة وتكلفة نماذجنا المتوسطة."
472-
},
473470
"anthropic.claude-3-haiku-20240307-v1:0": {
474471
"description": "Claude 3 Haiku هو أسرع وأصغر نموذج من Anthropic، يوفر سرعة استجابة شبه فورية. يمكنه بسرعة الإجابة على الاستفسارات والطلبات البسيطة. سيتمكن العملاء من بناء تجربة ذكاء اصطناعي سلسة تحاكي التفاعل البشري. يمكن لـ Claude 3 Haiku معالجة الصور وإرجاع إخراج نصي، مع نافذة سياقية تبلغ 200K."
475472
},
@@ -800,6 +797,9 @@
800797
"gemini-2.0-flash-001": {
801798
"description": "Gemini 2.0 Flash يقدم ميزات وتحسينات من الجيل التالي، بما في ذلك سرعة فائقة، واستخدام أدوات أصلية، وتوليد متعدد الوسائط، ونافذة سياق تصل إلى 1M توكن."
802799
},
800+
"gemini-2.0-flash-lite-001": {
801+
"description": "نموذج جمنّي 2.0 فلاش هو نسخة معدلة، تم تحسينها لتحقيق الكفاءة من حيث التكلفة والحد من التأخير."
802+
},
803803
"gemini-2.0-flash-lite-preview-02-05": {
804804
"description": "نموذج Gemini 2.0 Flash، تم تحسينه لأهداف التكلفة المنخفضة والكمون المنخفض."
805805
},
@@ -1484,6 +1484,9 @@
14841484
"qwen-max-latest": {
14851485
"description": "نموذج لغة ضخم من Qwen بمستوى تريليونات، يدعم إدخال لغات مختلفة مثل الصينية والإنجليزية، وهو النموذج API وراء إصدار Qwen 2.5."
14861486
},
1487+
"qwen-omni-turbo-latest": {
1488+
"description": "تدعم نماذج كيوين-أومني إدخال بيانات متعددة الأنماط، بما في ذلك الفيديو والصوت والصور والنصوص، وتخرج الصوت والنص."
1489+
},
14871490
"qwen-plus": {
14881491
"description": "نموذج لغة ضخم من توغي، نسخة معززة، يدعم إدخال لغات مختلفة مثل الصينية والإنجليزية."
14891492
},
@@ -1676,6 +1679,9 @@
16761679
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
16771680
"description": "Claude 3.5 Sonnet يرفع المعايير الصناعية، حيث يتفوق على نماذج المنافسين وClaude 3 Opus، ويظهر أداءً ممتازًا في تقييمات واسعة، مع سرعة وتكلفة تتناسب مع نماذجنا المتوسطة."
16781681
},
1682+
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
1683+
"description": "كلود 3.7 سونيت هو أسرع نموذج من الجيل التالي من أنثروبيك. مقارنةً بكلود 3 هايكو، تم تحسين كلود 3.7 سونيت في جميع المهارات، وتجاوز العديد من اختبارات الذكاء لأكبر نموذج من الجيل السابق، كلود 3 أوبس."
1684+
},
16791685
"whisper-1": {
16801686
"description": "نموذج التعرف على الصوت العام، يدعم التعرف على الصوت متعدد اللغات، والترجمة الصوتية، والتعرف على اللغات."
16811687
},

locales/ar/plugin.json

+12
Original file line numberDiff line numberDiff line change
@@ -140,6 +140,18 @@
140140
"close": "حذف",
141141
"confirm": "تم تكوينه وإعادة المحاولة"
142142
},
143+
"crawPages": {
144+
"crawling": "جاري التعرف على الروابط",
145+
"detail": {
146+
"preview": "معاينة",
147+
"raw": "النص الأصلي",
148+
"tooLong": "محتوى النص طويل جداً، سيتم الاحتفاظ بـ 10000 حرف فقط من سياق المحادثة، ولن يتم احتساب الأجزاء الزائدة في سياق المحادثة"
149+
},
150+
"meta": {
151+
"crawler": "وضع الزحف",
152+
"words": "عدد الأحرف"
153+
}
154+
},
143155
"searchxng": {
144156
"baseURL": "الرجاء الإدخال",
145157
"description": "الرجاء إدخال عنوان URL لـ SearchXNG لبدء البحث عبر الإنترنت",

locales/bg-BG/models.json

+9-3
Original file line numberDiff line numberDiff line change
@@ -467,9 +467,6 @@
467467
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
468468
"description": "Claude 3.5 Sonnet повишава индустриалните стандарти, с производителност, надминаваща конкурентните модели и Claude 3 Opus, показвайки отлични резултати в широки оценки, като същевременно предлага скорост и разходи, характерни за нашите модели от среден клас."
469469
},
470-
"anthropic.claude-3-7-sonnet-20250219-v1:0": {
471-
"description": "Claude 3.7 Sonnet повишава индустриалните стандарти, с производителност, надвишаваща конкурентните модели и Claude 3 Opus, с отлични резултати в широки оценки, като същевременно предлага скорост и разходи, характерни за нашите модели от среден клас."
472-
},
473470
"anthropic.claude-3-haiku-20240307-v1:0": {
474471
"description": "Claude 3 Haiku е най-бързият и компактен модел на Anthropic, предлагащ почти мигновена скорост на отговор. Той може бързо да отговаря на прости запитвания и заявки. Клиентите ще могат да изградят безпроблемно AI изживяване, имитиращо човешко взаимодействие. Claude 3 Haiku може да обработва изображения и да връща текстови изходи, с контекстуален прозорец от 200K."
475472
},
@@ -800,6 +797,9 @@
800797
"gemini-2.0-flash-001": {
801798
"description": "Gemini 2.0 Flash предлага следващо поколение функции и подобрения, включително изключителна скорост, нативна употреба на инструменти, многомодално генериране и контекстен прозорец от 1M токена."
802799
},
800+
"gemini-2.0-flash-lite-001": {
801+
"description": "Gemini 2.0 Flash е вариант на модела, оптимизиран за икономичност и ниска латентност."
802+
},
803803
"gemini-2.0-flash-lite-preview-02-05": {
804804
"description": "Модел на Gemini 2.0 Flash, оптимизиран за икономичност и ниска латентност."
805805
},
@@ -1484,6 +1484,9 @@
14841484
"qwen-max-latest": {
14851485
"description": "Qwen Max е езиков модел с мащаб от стотици милиарди параметри, който поддържа вход на различни езици, включително китайски и английски. В момента е основният API модел зад версията на продукта Qwen 2.5."
14861486
},
1487+
"qwen-omni-turbo-latest": {
1488+
"description": "Моделите от серията Qwen-Omni поддържат входни данни от множество модалности, включително видео, аудио, изображения и текст, и генерират аудио и текст."
1489+
},
14871490
"qwen-plus": {
14881491
"description": "通义千问(Qwen) е подобрена версия на мащабен езиков модел, който поддържа вход на различни езици, включително китайски и английски."
14891492
},
@@ -1676,6 +1679,9 @@
16761679
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
16771680
"description": "Claude 3.5 Sonnet повишава индустриалните стандарти, с производителност, надминаваща конкурентните модели и Claude 3 Opus, показвайки отлични резултати в широк спектър от оценки, като същевременно предлага скорост и разходи, сравними с нашите модели от средно ниво."
16781681
},
1682+
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
1683+
"description": "Claude 3.7 сонет е най-бързият модел от следващото поколение на Anthropic. В сравнение с Claude 3 Haiku, Claude 3.7 Сонет е подобрен във всички умения и надминава най-големия модел от предишното поколение Claude 3 Opus в много интелектуални тестове."
1684+
},
16791685
"whisper-1": {
16801686
"description": "Универсален модел за разпознаване на реч, поддържащ многоезично разпознаване на реч, превод на реч и разпознаване на езици."
16811687
},

locales/bg-BG/plugin.json

+12
Original file line numberDiff line numberDiff line change
@@ -140,6 +140,18 @@
140140
"close": "Изтриване",
141141
"confirm": "Конфигурацията е завършена и опитайте отново"
142142
},
143+
"crawPages": {
144+
"crawling": "Разпознаване на връзки",
145+
"detail": {
146+
"preview": "Преглед",
147+
"raw": "Оригинален текст",
148+
"tooLong": "Съдържанието на текста е твърде дълго, контекстът на разговора запазва само първите 10000 символа, а останалата част не се включва в контекста на разговора"
149+
},
150+
"meta": {
151+
"crawler": "Режим на улавяне",
152+
"words": "Брой символи"
153+
}
154+
},
143155
"searchxng": {
144156
"baseURL": "Моля, въведете",
145157
"description": "Моля, въведете URL адреса на SearchXNG, за да започнете търсене в мрежата",

locales/de-DE/models.json

+9-3
Original file line numberDiff line numberDiff line change
@@ -467,9 +467,6 @@
467467
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
468468
"description": "Claude 3.5 Sonnet setzt neue Maßstäbe in der Branche, übertrifft die Modelle der Konkurrenz und Claude 3 Opus, und zeigt in umfassenden Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittelgroßen Modelle beibehält."
469469
},
470-
"anthropic.claude-3-7-sonnet-20250219-v1:0": {
471-
"description": "Claude 3.7 Sonnet hebt den Branchenstandard an, übertrifft die Modelle der Konkurrenz und Claude 3 Opus, und zeigt in umfassenden Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittelgroßen Modelle beibehält."
472-
},
473470
"anthropic.claude-3-haiku-20240307-v1:0": {
474471
"description": "Claude 3 Haiku ist das schnellste und kompakteste Modell von Anthropic und bietet nahezu sofortige Reaktionsgeschwindigkeiten. Es kann schnell einfache Anfragen und Anforderungen beantworten. Kunden werden in der Lage sein, nahtlose AI-Erlebnisse zu schaffen, die menschliche Interaktionen nachahmen. Claude 3 Haiku kann Bilder verarbeiten und Textausgaben zurückgeben, mit einem Kontextfenster von 200K."
475472
},
@@ -800,6 +797,9 @@
800797
"gemini-2.0-flash-001": {
801798
"description": "Gemini 2.0 Flash bietet nächste Generation Funktionen und Verbesserungen, einschließlich außergewöhnlicher Geschwindigkeit, nativer Werkzeugnutzung, multimodaler Generierung und einem Kontextfenster von 1M Tokens."
802799
},
800+
"gemini-2.0-flash-lite-001": {
801+
"description": "Gemini 2.0 Flash ist eine Modellvariante, die auf Kosteneffizienz und niedrige Latenz optimiert ist."
802+
},
803803
"gemini-2.0-flash-lite-preview-02-05": {
804804
"description": "Ein Gemini 2.0 Flash Modell, das auf Kosteneffizienz und niedrige Latenz optimiert wurde."
805805
},
@@ -1484,6 +1484,9 @@
14841484
"qwen-max-latest": {
14851485
"description": "Der Tongyi Qianwen ist ein Sprachmodell mit einem Umfang von mehreren Billionen, das Eingaben in verschiedenen Sprachen wie Chinesisch und Englisch unterstützt und die API-Modelle hinter der aktuellen Version 2.5 von Tongyi Qianwen darstellt."
14861486
},
1487+
"qwen-omni-turbo-latest": {
1488+
"description": "Die Qwen-Omni-Serie unterstützt die Eingabe von Daten in verschiedenen Modalitäten, einschließlich Video, Audio, Bilder und Text, und gibt Audio und Text aus."
1489+
},
14871490
"qwen-plus": {
14881491
"description": "Qwen Plus ist die verbesserte Version des großangelegten Sprachmodells, das Eingaben in verschiedenen Sprachen wie Chinesisch und Englisch unterstützt."
14891492
},
@@ -1676,6 +1679,9 @@
16761679
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
16771680
"description": "Claude 3.5 Sonnet hebt den Branchenstandard an, übertrifft die Konkurrenzmodelle und Claude 3 Opus und zeigt in umfangreichen Bewertungen hervorragende Leistungen, während es die Geschwindigkeit und Kosten unserer mittelgroßen Modelle beibehält."
16781681
},
1682+
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
1683+
"description": "Claude 3.7 Sonett ist das schnellste nächste Modell von Anthropic. Im Vergleich zu Claude 3 Haiku hat Claude 3.7 Sonett in allen Fähigkeiten Verbesserungen erfahren und übertrifft in vielen intellektuellen Benchmark-Tests das größte Modell der vorherigen Generation, Claude 3 Opus."
1684+
},
16791685
"whisper-1": {
16801686
"description": "Allgemeines Spracherkennungsmodell, unterstützt mehrsprachige Spracherkennung, Sprachübersetzung und Spracherkennung."
16811687
},

locales/de-DE/plugin.json

+12
Original file line numberDiff line numberDiff line change
@@ -140,6 +140,18 @@
140140
"close": "Löschen",
141141
"confirm": "Konfiguration abgeschlossen und erneut versucht"
142142
},
143+
"crawPages": {
144+
"crawling": "Linkerkennung läuft",
145+
"detail": {
146+
"preview": "Vorschau",
147+
"raw": "Ursprünglicher Text",
148+
"tooLong": "Der Textinhalt ist zu lang, der Gesprächskontext behält nur die ersten 10000 Zeichen, der übersteigende Teil wird nicht in den Gesprächskontext einbezogen"
149+
},
150+
"meta": {
151+
"crawler": "Crawler-Modus",
152+
"words": "Zeichenanzahl"
153+
}
154+
},
143155
"searchxng": {
144156
"baseURL": "Bitte eingeben",
145157
"description": "Geben Sie die URL von SearchXNG ein, um mit der Online-Suche zu beginnen",

locales/en-US/models.json

+9-3
Original file line numberDiff line numberDiff line change
@@ -467,9 +467,6 @@
467467
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
468468
"description": "Claude 3.5 Sonnet raises the industry standard, outperforming competing models and Claude 3 Opus, excelling in extensive evaluations while maintaining the speed and cost of our mid-tier models."
469469
},
470-
"anthropic.claude-3-7-sonnet-20250219-v1:0": {
471-
"description": "Claude 3.7 Sonnet is Anthropic's latest model, offering a balance of speed and performance. It excels in a wide range of tasks, including programming, data science, visual processing, and agent tasks."
472-
},
473470
"anthropic.claude-3-haiku-20240307-v1:0": {
474471
"description": "Claude 3 Haiku is Anthropic's fastest and most compact model, providing near-instantaneous response times. It can quickly answer simple queries and requests. Customers will be able to build seamless AI experiences that mimic human interaction. Claude 3 Haiku can process images and return text output, with a context window of 200K."
475472
},
@@ -800,6 +797,9 @@
800797
"gemini-2.0-flash-001": {
801798
"description": "Gemini 2.0 Flash offers next-generation features and improvements, including exceptional speed, native tool usage, multimodal generation, and a 1M token context window."
802799
},
800+
"gemini-2.0-flash-lite-001": {
801+
"description": "Gemini 2.0 Flash is a variant of the model optimized for cost-effectiveness and low latency."
802+
},
803803
"gemini-2.0-flash-lite-preview-02-05": {
804804
"description": "A Gemini 2.0 Flash model optimized for cost-effectiveness and low latency."
805805
},
@@ -1484,6 +1484,9 @@
14841484
"qwen-max-latest": {
14851485
"description": "Tongyi Qianwen Max is a large-scale language model with hundreds of billions of parameters, supporting input in various languages, including Chinese and English. It is the API model behind the current Tongyi Qianwen 2.5 product version."
14861486
},
1487+
"qwen-omni-turbo-latest": {
1488+
"description": "The Qwen-Omni series of models supports input of various modalities, including video, audio, images, and text, and outputs both audio and text."
1489+
},
14871490
"qwen-plus": {
14881491
"description": "Qwen Plus is an enhanced large-scale language model supporting input in various languages including Chinese and English."
14891492
},
@@ -1676,6 +1679,9 @@
16761679
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
16771680
"description": "Claude 3.5 Sonnet raises the industry standard, outperforming competitor models and Claude 3 Opus, excelling in a wide range of evaluations while maintaining the speed and cost of our mid-tier models."
16781681
},
1682+
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
1683+
"description": "Claude 3.7 Sonnet is Anthropic's fastest next-generation model. Compared to Claude 3 Haiku, Claude 3.7 Sonnet shows improvements across various skills and surpasses the previous generation's largest model, Claude 3 Opus, in many intelligence benchmark tests."
1684+
},
16791685
"whisper-1": {
16801686
"description": "A universal speech recognition model that supports multilingual speech recognition, speech translation, and language identification."
16811687
},

locales/en-US/plugin.json

+12
Original file line numberDiff line numberDiff line change
@@ -140,6 +140,18 @@
140140
"close": "Delete",
141141
"confirm": "Configuration completed, please retry"
142142
},
143+
"crawPages": {
144+
"crawling": "Identifying links",
145+
"detail": {
146+
"preview": "Preview",
147+
"raw": "Raw text",
148+
"tooLong": "Text content is too long; only the first 10000 characters of the conversation context will be retained, and any excess will not be included in the conversation context."
149+
},
150+
"meta": {
151+
"crawler": "Crawling Mode",
152+
"words": "Character count"
153+
}
154+
},
143155
"searchxng": {
144156
"baseURL": "Please enter",
145157
"description": "Enter the URL for SearchXNG to start online searching",

0 commit comments

Comments
 (0)