
เมื่อวันที่ 6 กุมภาพันธ์ 2024 เราได้ประกาศโมเดลใหม่ 8 โมเดลที่เราเพิ่มลงในแค็ตตาล็อกของเราสำหรับกรณีการใช้งานในการสร้างข้อความ การจัดหมวดหมู่ และการสร้างโค้ด วันนี้ เรากลับมาพร้อมกับโมเดลอีกสิบเจ็ด (17!) แบบ ซึ่งมุ่งเน้นไปที่การเปิดใช้งานงานประเภทใหม่ๆ และกรณีการใช้งานด้วย Workers AI ขณะนี้แค็ตตาล็อกของเรามีโมเดลเกือบ 40 รุ่นแล้ว ดังนั้นเราจึงตัดสินใจที่จะแนะนำการปรับปรุงเอกสารประกอบสำหรับนักพัฒนาของเรา ซึ่งช่วยให้ผู้ใช้สามารถค้นหาและค้นพบโมเดลใหม่ๆ ได้อย่างง่ายดาย
โมเดลใหม่มีการระบุไว้ด้านล่าง และสามารถดูแค็ตตาล็อก Workers AI ฉบับเต็มได้ในเอกสารประกอบสำหรับนักพัฒนาใหม่ของเรา
Text generation
-
@cf/deepseek-ai/deepseek-math-7b-instruct
-
@cf/openchat/openchat-3.5-0106
-
@cf/microsoft/phi-2
-
@cf/tinyllama/tinyllama-1.1b-chat-v1.0
-
@cf/thebloke/discolm-german-7b-v1-awq
-
@cf/qwen/qwen1.5-0.5b-chat
-
@cf/qwen/qwen1.5-1.8b-chat
-
@cf/qwen/qwen1.5-7b-chat-awq
-
@cf/qwen/qwen1.5-14b-chat-awq
-
@cf/tiiuae/falcon-7b-instruct
-
@cf/defog/sqlcoder-7b-2
Summarization
-
@cf/facebook/bart-large-cnn
Text-to-image
-
@cf/lykon/dreamshaper-8-lcm
-
@cf/runwayml/stable-diffusion-v1-5-inpainting
-
@cf/runwayml/stable-diffusion-v1-5-img2img
-
@cf/bytedance/stable-diffusion-xl-lightning
Image-to-text
-
@cf/unum/uform-gen2-qwen-500m
โมเดลภาษาใหม่ การปรับแต่ง และการหาปริมาณ
การอัปเดตแค็ตตาล็อกวันนี้ประกอบด้วยโมเดลภาษาใหม่จำนวนหนึ่ง เพื่อให้นักพัฒนาสามารถเลือกและเลือก LLM ที่ดีที่สุดสำหรับกรณีการใช้งานของตนได้ แม้ว่า LLM ส่วนใหญ่สามารถนำไปใช้งานได้ในทุกกรณี แต่การเลือกรุ่นที่ได้รับการปรับแต่งให้เหมาะกับกรณีการใช้งานเฉพาะก็มีประโยชน์มากมาย เรารู้สึกตื่นเต้นที่จะนำเสนอโมเดลภาษาขนาดใหญ่ (LLM) โมเดลภาษาขนาดเล็ก (SLM) และการรองรับหลายภาษาใหม่ๆ ให้กับคุณ รวมถึงโมเดลที่ได้รับการปรับแต่งและเชิงปริมาณบางโมเดล
LLM เพิ่มเติมล่าสุดของเราประกอบด้วย falcon-7b-instruct ซึ่งน่าตื่นเต้นอย่างยิ่งเนื่องจากมีการใช้นวัตกรรมในการเอาใจใส่หลายแบบสอบถามเพื่อสร้างการตอบสนองที่มีความแม่นยำสูง นอกจากนี้ยังมีการรองรับภาษาที่ดีกว่าด้วยรุ่น discolm_german_7b และ qwen1.5 ซึ่งได้รับการฝึกฝนเกี่ยวกับข้อมูลหลายภาษาและมีเอาต์พุต LLM ที่น่าประทับใจไม่เพียงแต่ในภาษาอังกฤษเท่านั้น แต่ยังรวมถึงภาษาเยอรมัน (discolm) และจีน (qwen1.5) ด้วย รุ่น Qwen มีพารามิเตอร์ตั้งแต่ 0.5B ถึง 14B และแสดงให้เห็นความแม่นยำที่น่าประทับใจเป็นพิเศษในการทดสอบของเรา นอกจากนี้ เรายังเปิดตัว SLM ใหม่สองสามรายการ ซึ่งกำลังได้รับความนิยมเพิ่มขึ้นเนื่องจากความสามารถในการอนุมานได้เร็วและราคาถูกกว่าโดยไม่ทำให้ความแม่นยำลดลง สำหรับ SLM เราขอแนะนำโมเดลขนาดเล็กแต่มีประสิทธิภาพ เช่น Llama เวอร์ชันพารามิเตอร์ 1.1B (tinyllama-1.1b-chat-v1.0) และโมเดลพารามิเตอร์ 1.3B จาก Microsoft (phi-2)
ในขณะที่อุตสาหกรรม AI ยังคงเติบโตอย่างรวดเร็ว ผู้มีความสามารถได้ค้นพบวิธีปรับปรุงและเพิ่มประสิทธิภาพประสิทธิภาพและความแม่นยำของแบบจำลอง เราได้เพิ่มโมเดลที่ได้รับการปรับแต่ง (openchat-3.5) ซึ่งใช้ Conditioned Reinforcement Learning Fine-Tuning (C-RLFT) ซึ่งเป็นเทคนิคที่ช่วยให้สามารถพัฒนาโมเดลภาษาโอเพ่นซอร์สผ่านการใช้ข้อมูลคุณภาพผสมที่รวบรวมได้ง่าย
เรารู้สึกตื่นเต้นมากที่จะนำโมเดลการสร้างข้อความใหม่ทั้งหมดนี้มาสู่แพลตฟอร์มของเราในวันนี้ ชุมชนโอเพ่นซอร์สมีการพัฒนาความก้าวหน้าด้าน AI ใหม่ๆ ได้อย่างเหลือเชื่อ และเรารู้สึกขอบคุณสำหรับการมีส่วนร่วมของทุกคนในการฝึกอบรม การปรับแต่ง และการหาปริมาณโมเดลเหล่านี้ เรารู้สึกตื่นเต้นมากที่สามารถโฮสต์โมเดลเหล่านี้และทำให้ทุกคนสามารถเข้าถึงได้ เพื่อให้นักพัฒนาสามารถสร้างแอปพลิเคชันใหม่ด้วย AI ได้อย่างรวดเร็วและง่ายดาย คุณสามารถดูโมเดลใหม่และสคีมา API ได้ในเอกสารสำหรับนักพัฒนาของเรา
โมเดลการสร้างภาพใหม่
เรากำลังเพิ่มไปป์ไลน์ Stable Diffusion และการเพิ่มประสิทธิภาพใหม่ เพื่อให้สามารถแก้ไขรูปภาพและกรณีการใช้งานการสร้างใหม่ได้อย่างมีประสิทธิภาพ เราได้เพิ่มการรองรับ Stable Diffusion XL Lightning ซึ่งสร้างภาพคุณภาพสูงโดยใช้เวลาเพียงสองขั้นตอนการอนุมาน การแปลงข้อความเป็นรูปภาพเป็นงานยอดนิยมสำหรับผู้ที่ต้องการรับข้อความและให้โมเดลสร้างรูปภาพตามอินพุต แต่ Stable Diffusion มีความสามารถมากกว่านั้นมาก ด้วยการเปิดตัว Workers AI ใหม่นี้ เราได้ปลดล็อกไปป์ไลน์ใหม่ เพื่อให้คุณสามารถทดลองรูปแบบอินพุตและงานต่างๆ ด้วย Stable Diffusion
ตอนนี้คุณสามารถใช้ Stable Diffusion บน Workers AI สำหรับกรณีการใช้งานแบบภาพต่อภาพและการวาดภาพ Image-to-image ช่วยให้คุณสามารถแปลงภาพที่ป้อนเข้าเป็นภาพอื่นได้ ตัวอย่างเช่น คุณสามารถขอให้ Stable Diffusion สร้างภาพบุคคลในรูปแบบการ์ตูนได้ Inpainting ช่วยให้ผู้ใช้สามารถอัพโหลดรูปภาพและแปลงรูปภาพเดิมให้กลายเป็นสิ่งใหม่ได้ ตัวอย่างของ inpainting ได้แก่ “การขยาย” พื้นหลังของภาพถ่าย หรือการปรับสีภาพถ่ายขาวดำ
หากต้องการใช้ inpainting คุณจะต้องป้อนรูปภาพ หน้ากาก และข้อความแจ้ง รูปภาพคือรูปภาพต้นฉบับที่คุณต้องการแก้ไข ส่วนมาส์กเป็นหน้าจอขาวดำที่เน้นพื้นที่ที่คุณต้องการทาสีทับ และข้อความแจ้งจะแจ้งให้โมเดลทราบว่าจะสร้างอะไรในพื้นที่นั้น ด้านล่างนี้เป็นตัวอย่างของอินพุตและเทมเพลตคำขอเพื่อดำเนินการวาดภาพ
import { Ai } from '@cloudflare/ai';
export default {
async fetch(request, env) {
const formData = await request.formData();
const prompt = formData.get("prompt")
const imageFile = formData.get("image")
const maskFile = formData.get("mask")
const imageArrayBuffer = await imageFile.arrayBuffer();
const maskArrayBuffer = await maskFile.arrayBuffer();
const ai = new Ai(env.AI);
const inputs = {
prompt,
image: [...new Uint8Array(imageArrayBuffer)],
mask: [...new Uint8Array(maskArrayBuffer)],
strength: 0.8, // Adjust the strength of the transformation
num_steps: 10, // Number of inference steps for the diffusion process
};
const response = await ai.run("@cf/runwayml/stable-diffusion-v1-5-inpainting", inputs);
return new Response(response, {
headers: {
"content-type": "image/png",
},
});
}
}
การใช้งานใหม่
นอกจากนี้เรายังได้เพิ่มโมเดลใหม่ให้กับ Workers AI ซึ่งช่วยให้ทำงานเฉพาะทางและกรณีการใช้งานต่างๆ ได้ เช่น LLM ที่เชี่ยวชาญในการแก้ปัญหาทางคณิตศาสตร์ (deepseek-math-7b-instruct) การสร้างโค้ด SQL (sqlcoder-7b-2) โดยสรุป ข้อความ (bart-large-cnn) และคำบรรยายภาพ (uform-gen2-qwen-500m)
เราต้องการเผยแพร่สิ่งเหล่านี้สู่สาธารณะ เพื่อให้คุณสามารถเริ่มสร้างร่วมกับพวกเขาได้ แต่เราจะเปิดตัวการสาธิตและเนื้อหาการฝึกสอนเพิ่มเติมในอีกไม่กี่สัปดาห์ข้างหน้า โปรดคอยติดตามบัญชี X และเอกสารสำหรับนักพัฒนาของเราสำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีใช้โมเดลใหม่เหล่านี้
การเพิ่มประสิทธิภาพแคตตาล็อกโมเดลของเรา
นวัตกรรมโมเดล AI กำลังก้าวหน้าอย่างรวดเร็ว เครื่องมือและเทคนิคสำหรับการอนุมานที่รวดเร็วและมีประสิทธิภาพก็เช่นกัน เรารู้สึกตื่นเต้นที่จะได้รวมเอาเครื่องมือใหม่ๆ ที่ช่วยเราเพิ่มประสิทธิภาพโมเดลของเรา เพื่อที่เราจะสามารถนำเสนอแพลตฟอร์มการอนุมานที่ดีที่สุดสำหรับทุกคน โดยทั่วไป เมื่อปรับการอนุมาน AI ให้เหมาะสม จะมีประโยชน์ในการทำให้โมเดลเป็นอนุกรมในรูปแบบ เช่น ONNX ซึ่งเป็นหนึ่งในตัวเลือกที่ใช้โดยทั่วไปมากที่สุดสำหรับกรณีการใช้งานนี้ พร้อมการรองรับฮาร์ดแวร์และสถาปัตยกรรมโมเดลในวงกว้าง คุณสามารถเพิ่มประสิทธิภาพโมเดล ONNX เพิ่มเติมได้โดยการแปลงเป็นกลไก TensorRT รูปแบบนี้ออกแบบมาโดยเฉพาะสำหรับ Nvidia GPU ซึ่งอาจส่งผลให้เวลาแฝงในการอนุมานเร็วขึ้นและปริมาณงานรวมที่สูงขึ้นจาก LLM การเลือกรูปแบบที่เหมาะสมมักจะขึ้นอยู่กับสถาปัตยกรรมโมเดลเฉพาะและฮาร์ดแวร์ที่พร้อมใช้งานสำหรับการอนุมานได้ดีที่สุด เราตัดสินใจใช้ประโยชน์จากทั้งรูปแบบ TensorRT และ ONNX สำหรับไปป์ไลน์ Stable Diffusion ใหม่ของเรา ซึ่งเป็นตัวแทนของชุดโมเดลที่ใช้สำหรับงานเฉพาะ
สำรวจเพิ่มเติมเกี่ยวกับเอกสารสำหรับนักพัฒนาใหม่ของเรา
คุณสามารถสำรวจโมเดลใหม่ทั้งหมดนี้ได้ในเอกสารสำหรับนักพัฒนาใหม่ของเรา ซึ่งคุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับแต่ละโมเดล เทมเพลตพร้อมท์ของโมเดลเหล่านั้น ตลอดจนคุณสมบัติต่างๆ เช่น การจำกัดโทเค็นบริบท เราได้ออกแบบหน้าโมเดลใหม่เพื่อให้นักพัฒนาสามารถสำรวจโมเดลใหม่ๆ และเรียนรู้วิธีใช้งานได้ง่ายขึ้น ตอนนี้คุณจะเห็นโมเดลทั้งหมดในหน้าเดียวเพื่อให้สามารถค้นหาได้ โดยมีประเภทงานอยู่ทางด้านขวามือ จากนั้น คุณสามารถคลิกเข้าไปในหน้าโมเดลแต่ละหน้าเพื่อดูตัวอย่างโค้ดเกี่ยวกับวิธีการใช้โมเดลเหล่านั้น

เราหวังว่าคุณจะลองใช้โมเดลใหม่เหล่านี้และสร้างสิ่งใหม่บน Workers AI! เราจะมีการอัปเดตเพิ่มเติมในเร็วๆ นี้ ซึ่งรวมถึงการสาธิต บทช่วยสอน และราคา Workers AI เพิ่มเติม แจ้งให้เราทราบว่าคุณกำลังทำอะไรอยู่และโมเดลอื่นๆ ที่คุณต้องการเห็นบน Discord ของเรา
เราปกป้องเครือข่ายองค์กรทั้งหมด ช่วยให้ลูกค้าสร้างแอปพลิเคชันระดับอินเทอร์เน็ตได้อย่างมีประสิทธิภาพ เร่งความเร็วเว็บไซต์หรือแอปพลิเคชันอินเทอร์เน็ต ปัดเป่าการโจมตี DDoS ป้องกันแฮกเกอร์ และสามารถช่วยคุณในการเดินทางสู่ Zero Trust
ไปที่ 1.1.1.1 จากอุปกรณ์ใดก็ได้เพื่อเริ่มต้นใช้งานแอปฟรีของเราซึ่งจะทำให้อินเทอร์เน็ตของคุณเร็วขึ้นและปลอดภัยยิ่งขึ้น
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับภารกิจของเราในการช่วยสร้างอินเทอร์เน็ตที่ดีขึ้น เริ่มต้นที่นี่ หากคุณกำลังมองหาทิศทางอาชีพใหม่ ลองดูตำแหน่งงานที่เปิดรับของเรา
เเหล่งอ้างอิง : Unlocking new use cases with 17 new models in Workers AI, including new LLMs, image generation models, and more (cloudflare.com)


Leave a Reply