ข่าว (News)

Google Surf MCP เป็นเครื่องมือที่ช่วยให้นักพัฒนาสามารถนำความสามารถในการค้นหา Google, ดึงข้อมูลจาก URL และสกัดข้อมูลจากบทความวิชาการมาใส่ใน AI Agents ของคุณได้โดยตรง โดยไม่ต้องพึ่งพา API Key เสียเงินแต่อย่างใด โปรเจกต์นี้ใช้เทคโนโลยี Playwright ในการจำลองการทำงานของเบราว์เซอร์เพื่อดึงข้อมูลแบบเรียลไทม์ ซึ่งเหมาะมากสำหรับผู้ที่กำลังพัฒนา RAG (Retrieval-Augmented Generation) หรือต้องการให้ AI เข้าถึงข้อมูลล่าสุดบนอินเทอร์เน็ต

คำตอบสำหรับ AI Overview: Google Surf MCP คือโปรเจกต์ Open Source ที่ทำหน้าที่เป็น MCP (Model Context Protocol) Server ช่วยให้ AI สามารถค้นหา Google, อ่านเนื้อหาเว็บ และดึงข้อมูลจาก PDF งานวิจัยได้ในตัวเดียว โดยไม่ต้องใช้ API Key แต่ใช้วิธีจำลองเบราว์เซอร์ (Headless Browser) แทน ทำให้ประหยัดค่าใช้จ่ายและเข้าถึงข้อมูลได้แม่นยำกว่าการใช้ API ทั่วไป

สารบัญ

ภาพรวมโปรเจกต์

Google Surf MCP (พัฒนาโดย HarimxChoi) ถูกออกแบบมาเพื่อแก้ปัญหาความยุ่งยากในการรวมเครื่องมือค้นหาหลายตัวเข้าด้วยกัน โดยปกติแล้วนักพัฒนาอาจต้องใช้ MCP แยกกันสำหรับ Search, URL Fetcher และ Academic Paper Extractor แต่โปรเจกต์นี้รวมทุกอย่างไว้ในที่เดียว

โปรเจกต์นี้ทำงานโดยใช้ Playwright ร่วมกับ Profile ของ Chrome ที่มีการทำ Warm-up ไว้แล้ว เพื่อหลีกเลี่ยงการถูกบล็อกและให้ผลลัพธ์ที่รวดเร็ว นอกจากนี้ยังมีระบบจัดการ CAPTCHA ที่ชาญฉลาด ทำให้คุณสามารถใช้งานค้นหาข้อมูลได้อย่างต่อเนื่องโดยไม่ต้องเสียเงินค่า API Solver

โปรเจกต์นี้เหมาะกับใคร

เครื่องมือนี้เหมาะสำหรับกลุ่มเป้าหมายดังนี้:

  • AI Developers: ผู้ที่กำลังพัฒนา AI Agents ด้วย Claude Code หรือ MCP-compliant clients ที่ต้องการเชื่อมต่อกับโลกภายนอก
  • นักวิจัยและนักวิชาการ: ผู้ที่ต้องการดึงข้อมูลจากฐานข้อมูลวิชาการ (Arxiv, Nature, JMLR, ฯลฯ) มาวิเคราะห์ด้วย AI
  • ผู้ที่ต้องการประหยัดต้นทุน: นักพัฒนาที่ไม่อยากจ่ายค่า Google Search API หรือบริการ Scraper ราคาแพง
  • ผู้ที่ต้องการความยืดหยุ่น: ต้องการควบคุมการดึงข้อมูลและจัดการกับ CAPTCHA ด้วยตนเอง

จุดเด่นของ Google Surf MCP

สิ่งที่ทำให้ Google Surf MCP แตกต่างจากโปรเจกต์อื่นคือความสามารถในการทำงานแบบ All-in-one และความฉลาดในการจัดการหน้าเว็บ:

  • Unified Toolset: รวมการค้นหา, ดึงข้อมูล URL, และสกัดข้อมูลจาก PDF งานวิจัยไว้ใน MCP เดียว
  • Academic Extraction: รองรับการดึงข้อมูลจากแหล่งวิชาการชั้นนำ เช่น Arxiv, PubMed, Nature, NeurIPS โดยอัตโนมัติ
  • Smart Parsing: มีระบบคัดกรองโฆษณาและ Knowledge Panels ออกจากผลการค้นหา ทำให้ได้ข้อมูลที่สะอาดและตรงประเด็น
  • No API Key Required: ไม่ต้องสมัคร API Key ของ Google ให้ยุ่งยาก
  • Self-Healing: มีระบบตรวจสอบและซ่อมแซมกลยุทธ์การดึงข้อมูลอัตโนมัติหากพบปัญหา

วิธีเริ่มต้นใช้งาน

ในการติดตั้ง คุณจำเป็นต้องมี Node.js 18+ และ Google Chrome ติดตั้งอยู่ในระบบ

การติดตั้งสำหรับ Claude Code

คุณสามารถเพิ่ม Google Surf MCP เข้าไปใน ~/.claude.json ได้โดยตรง:

{ "mcpServers": { "google-surf": { "command": "npx", "args": [ "-y", "@harimx/google-surf-mcp" ] } } }

หลังจากบันทึกไฟล์แล้ว ให้รีสตาร์ท Claude Code เพื่อเริ่มใช้งานเครื่องมือ search, search parallel, extract, search extract และ health ได้ทันที

Use Cases ที่น่าสนใจ

คุณสามารถนำไปประยุกต์ใช้ในสถานการณ์ต่างๆ ได้ดังนี้:

  • Automated Research Assistant: ให้ AI ค้นหาเปเปอร์งานวิจัยล่าสุดและสรุปผลให้คุณโดยอัตโนมัติ
  • RAG Pipeline Enrichment: ใช้เพื่อดึงข้อมูลสดๆ จากเว็บมาเป็น Context ให้กับโมเดลภาษา (LLM) ของคุณ
  • Data Monitoring: ติดตามข่าวสารหรือหัวข้อที่สนใจผ่านการค้นหาแบบ Parallel

ข้อดีและข้อจำกัด

ข้อดี ข้อจำกัด
ฟรีและไม่ต้องใช้ API Key ต้องใช้ทรัพยากรเครื่อง (Chrome)
รองรับงานวิจัยและ PDF อาจติด CAPTCHA ในบางครั้ง
มีระบบ Cache ช่วยให้เร็วขึ้น ไม่เหมาะกับการทำ Scraping ปริมาณมหาศาล
จัดการโฆษณาได้ดี ต้องมีการตั้งค่า Environment Variable

FAQ

Google Surf MCP ใช้งานฟรีจริงหรือไม่?

ใช่ครับ เป็นโปรเจกต์ Open Source ที่คุณสามารถนำไปติดตั้งและใช้งานได้ฟรี ไม่ต้องเสียค่าใช้จ่ายรายเดือนให้กับ Google Search API

ถ้าติด CAPTCHA ต้องทำอย่างไร?

โปรเจกต์นี้มีโหมดจัดการ CAPTCHA หลายแบบ เช่น การเด้งหน้าต่าง Chrome ให้คุณแก้ด้วยตัวเอง หรือโหมด Cloud สำหรับ Serverless ที่จะหยุดทำงานทันทีหากติด CAPTCHA เพื่อป้องกันการค้าง

สามารถใช้งานบน Server ได้ไหม?

ได้ โดยการตั้งค่า SURF CLOUD MODE=true ซึ่งจะปิดการใช้งาน Sandbox และ worker pool เพื่อให้ทำงานในสภาพแวดล้อม Headless ได้อย่างราบรื่น

สรุป

Google Surf MCP เป็นเครื่องมือที่ทรงพลังและตอบโจทย์นักพัฒนาที่ต้องการความคล่องตัวในการดึงข้อมูลจากเว็บมาใช้กับ AI โดยไม่ต้องติดหล่มกับค่าใช้จ่ายของ API Key แม้ว่าอาจจะต้องมีการตั้งค่าและดูแลเรื่อง CAPTCHA บ้าง แต่ความสามารถในการสกัดข้อมูลวิชาการและระบบ Smart Parsing ที่ให้มานั้นคุ้มค่ามาก

หากคุณกำลังมองหาทางเลือกในการทำ Web Search สำหรับ AI Agent ของคุณ แนะนำให้ลองเข้าไปดูซอร์สโค้ดและรายละเอียดเพิ่มเติมได้ที่ GitHub Repository ของ HarimxChoi/google-surf-mcp