การทำภาพบน ComfyUI ด้วย ภาษาไทย Ep.2 SDXL with thai prompt

การทำภาพบน ComfyUI ด้วย ภาษาไทย Ep.2

ณ ปัจจุบัน Stable Diffusion หรือ ComfyUI เอง ยังไม่สามารถ สั่ง Generated Image ด้วยภาษาไทยได้โดยตรง

ส่วนใหญ่ จะเป็น ส่วนเสริมที่ช่วยในการแปลภาษา หรือ โมเดลเฉพาะทาง ขนาดเล็กทื่ช่วยเขียน Promptให้ดีขึ้นได้

โมเดล SDXL ถูกพัฒนามาให้เข้าใจ ภาษาธรรมชาติ หรือ ภาษาทั่วไปมากยิ่งขึ้น

จากการที่ผมได้ทดสอบและ ลองใช้งาน ก็เห็นได้ว่าการใช้ ภาษาธรรมชาติ ช่วยให้ภาพมี องค์ประกอบ และ มิติมากยิ่งขึ้น แต่หลายๆคน อย่างเช่นผมเอง ก็ติดปัญหาในการใช้ภาษาอังกฤษ จะเขียนอย่างไร หรืทอใช้คำศัพท์ไหนให้ออกมาเรียบร้อย สวยงาม เข้าใจง่าย

Ollama เป็นโปรแกรม ที่ ใช้ โมเดลภาษา ช่วยในการ วิเคราะห์และ แปลความหมาย สิ่งที่เราต้องการให้สื่อสารเป็นภาษาอังกฤษได้ง่ายดาย รองรับการใช้งานโมเดล LLM แบบต่างๆ เช่น

LLaMa 3.2 3B – โมเดลใหม่ล่าสุดของ Meta รองรับภาษาต่างประเทศได้มากถึง 8 ภาษา รวมทั้ง ภาษาไทยด้วย

หลังจาก เราทำการติดตั้ง + ลงโมเดล Ollama จนใช้งานได้แล้ว ใน EP1 (ใครข้ามไป ย้อนตามได้ที่ Link EP1 การติดตั้ง Ollama)

ต่อมาจะเป็นการ เซตอัพ ระบบ ComfyUI ให้สามารถใช้งาน Ollama ได้ กันนะครับ

ผมขอข้าม การติดตั้ง ComfyUI ไปก่อนนะครับ เดี๋ยวจะมา สอนอีกที

1. การใช้งานกับ โมเดล SDXL

1.1 ข้อจำกัดของ การใช้งานเอไอ บนเครื่องตนเอง

เอไอ ในปัจจุบันยังเป็นเรื่อง ที่ ใหม่มาก หลายๆส่วนถูกพัฒนามาจากห้องวิจัย ที่มีเครื่อง Super Computer ใช้งาน

หลายทีมพยายาม ผลักดันให้ โมเดลมีขนาดเล็กลง ประมวลผลได้ไวขึ้น โดยยังคงประสิทธิภาพคงเดิม หรือใกล้เคียง

การใช้งาน การทำภาพบน ComfyUI ด้วย Prompt ภาษาไทย เป็นการใช้งานเอไอ 2 ส่วนด้วยกัน คือ

LLM ส่วนในการ รับคำสั่ง ภาษาไทย ประมวลผลลัพธ์ให้ใกล้เคียงตามคำสั่งแล้วแปลงเป็นภาษาอังกฤษ
Stable Diffusion ส่วนนี้ใช้โมเดลประเภท SDXL, Pony ได้ จะเข้าใจภาษาธรรมชาติมากว่า และได้ภาพที่มีรายละเอียดดีกว่า SD1.5

(สามารถใช้ โมเดล SD1.5 ได้ โดยการเพิ่มคำสั่งในส่วนของ LLM ให้สร้าง Prompt ในรูปแบบที่ SD1.5 รองรับ)

จากรายละเอียดข้างต้น จะเป็นการทำงานของโปรแกรมใหญ่ 2 โปรแกรม บนเครื่องของเรา จึงจำเป็นต้องมี การ์ดจอ VRAM อย่างน้อย 12GB เพื่อใช้ในการทำงาน หรือ ควรมี RAM 32GB ขึ้นไป กรณี VRAM จาก การ์ดจอ ไม่พอ

(สำหรับ FLUX ต้องใช้ VRAM 16GB + RAM 32GB ซึ่งจะกล่าว EP ถัดไป)

1.2 เตรียมโมเดล SDXL และ ComfyUI workflow เพื่อการใช้งาน

SDXL Model ดาวน์โหลดได้ ที่ ลิ้งนี้ Civitai
วางโมเดลที่ Folder ComfyUImodelscheckpoints
SDXL Vae ดาวน์โหลดได้ที่ ลิ้งนี้ SDXL_VAE
วางโมเดลที่ Folder ComfyUImodelsvae
โมเดลอัพสเกล ดาวน์โหลดได้ที่ ลิ้งนี้ 4x-ultrasharp
วางโมเดลที่ Folder ComfyUImodelsupscale_models
Generate image ComfyUI with Thai promt workflow เซฟ ไฟล์นี้ เป็น json ไฟล์

1.3 เปิดระบบ Ollama และ ComfyUI

Ollama เปิด โดย กดเปิด แอฟ Ollama
ComfyUI เปิดโดย การ รันไฟล์ run_nvidia_gpu.bat ใน folder โปรแกรม ComfyUI (หรือตามแอฟที่ติดตั้ง)

สำหรับ Ollama สามารถย้อนดูรายละเอียดเพิ่มเติมได้ใน การทำภาพบน ComfyUI ด้วย ภาษาไทย Ep.1

2. การใช้งาน Generate image ComfyUI with Thai promt workflow

2.1 การใช้งาน Generate image ComfyUI with Thai promt workflow

เปิด Workflow ComfyUI ด้วย การ ลากไฟล์ json ไปวางในหน้าComfyUI

(workflow ดาวน์โหลดได้ในลิ้ง หัวข้อ 1.2 กดเซฟ จะเป็นไฟล์ .json)

3. อธิบาย node group ต่างๆ ใน Workflow SDXL+Thai prompt

3.1 SDXL Basic – workflow พื้นฐานในการ เจนเนอเรทภาพด้วยโมเดล SDXL

SDXL เป็น โมเดลที่เป็นที่นิยมมาก มีการปรับปรุงหลายเวอร์ชั่น ทั้ง SDXL, Pony, Illustrious, noobAI การเลือกใช้งานแต่ละโมเดล จะมี จุดที่แตกต่างกันคือ

การเขียน Prompt เช่น score_9, masterpiece
ค่า CFG 3 – 7 ค่าที่ไม่ถูกต้องอาจะทำให้ภาพพิดเพี้ยนไปได้
Sampler_name แนะนำเป็น euler จะใช้งานได้ ครอบคลุม
Scheduler แนะนำเป็น Simple หรือ karras

ค่า พารามิเตอร์เหล่านี้ สามารถศึกษาเพิ่มเติมได้ จากผู้พัฒนาโมเดลนั้นๆ มักจะมีรายละเอียดบอกในหน้า description ของโมเดล

3.2 Lora node – ส่วนเสริม สำหรับผู้ที่ต้องการใช้งาน Lora แบบต่างๆ ไม่ว่าจะเป็น Charactor, Style, finetune

** ตรวจสอบค่า weight (lora_wt) ค่านี้ไม่ควรเกิน 1

กรณีไม่ได้ใช้งาน แนะนำ ให้ เลือก 2 node นี้ คลิกขวา แล้ว เลือก Bypass

3.3 Ollama Node – workflow นี้ จะเรียกใช้งาน LLM model ผ่าน API ของ Ollama

URL – default จะเป็นเครื่องเราเองที่เปิด Ollama ไว้แล้ว
model – กรณี ลงโมเดล LLM ไว้หลายตัว สามารถเลือกใช้งานได้ที่ตรงนี้ ซึ่งแต่ละโมเดลจะมีความสามารถแตกต่างกัน และใช้ทรัพยากรเครื่อง แตกต่างกันด้วย

สำหรับโมเดลภาษาไทย แนะนำเป็น

llama 3.2 3B เป็นโมเดลตัวล่าสุดของ Meta ที่รองรับ ภาษาไทย

Typhoon เป็นโมเดล ภาษา ที่พัฒนาโดยคนไทย

(โมเดล Vision จะสามารถ ใส่รูปภาพ เพื่อแปลงเป็น Prompt ขอกล่าวใน EP ถัดไปนะ)

3.4 Ultimate SD Upscale – ส่วนนี้จะทำการแบ่งภาพเป็นส่วนย่อย ทำการอัพสเกลทีละส่วนแล้วนำมารวมกันใหม่จะได้ภาพขนาดใหญ่

จะใช้เวลาค่อนข้างนาน ถ้าไม่ต้องการแนะนำให้ เลือก Ultimate SD Upscale node คลิกขวา แล้วเลือก Bypass

3.5 Compare Image – เปรียบทียบ ภาพ ที่เจนเนอเรท กับ ภาพที่ ผ่านการอัพสเกลแล้ว ซึ่ง 2 ภาพนี้จะเก็บอยู่ใน ComfyUIoutputSDXL

แล้วเรามาต่อ EP ถัดไปกับการใช้งาน Ollama บน ComfyUI แบบละเอียดกัน

สำหรับใครที่ถูกใจเนื้อหา ฝาก กด Like กด แชร์ให้แอดด้วยนะ

Salmon Romkwan

1 Comment

Add Your Comment

Shopping cart