🧪 کیفیت‌سنجی AI Agent Skillها

🧪 کیفیت‌سنجی AI Agent Skillها

اگر با مفهوم و ساختار skill آشنا نیستین، پیشتر در موردش نوشتم (مقدمه‌ای بر Skills، مهارت‌آموزی AI برای توسعه نرم‌افزار)

دیگه Skill خوب نوشتن، مثل خوب کد نوشتن، یکی از معیارهای برنامه‌نویس خوب بود شده. گاهی فکر می‌کنم صرف نوشتن یه Agent Skill همه چیز تمومه؛ در حالی که این‌طور نیست و معلوم نیست اسکیلی که نوشتیم چقدر خوب کار می‌کنه و شاید حتی استفاده نشه یا برای مدل، بدآموزی داشته باشه! طی یک سال گذشته، به جز کدریویو، من کلی اسکیل‌ریویو هم کردم و قبل از این ابزارها، که توی این مطلب معرفی خواهم کرد؛ ابزارهای داخلی برای تیم توسعه دادیم چون بنچمارک‌هایی که روی کدبیس‌های بزرگ داشتم نشون میده که مدل‌های AI و ابزارهای مختلف، خیلی به کیفیت و ساختار اسکیل اهمیت می‌دن (یا به بیان بهتر ازش اثرپذیری دارن). ولی الان ابزارهای کدبازی مثل waza یا skill validator هستن که در مورد کیفیت اسکیل‌ها بررسی انجام می‌دن و اگر از AI استفاده می‌کنین؛ استفاده ازشون حیاتی به نظر میاد.

مثلا شاید بگین ساختار و spec رو رعایت کردم؛ ولی لینک‌هات سالمن؟ token budget رو رعایت کردی؟ روی Claude و GPT هر دو یه‌جور رفتار می‌کنه؟ agent واقعاً می‌دونه کِی باید این skill رو استفاده کنه؟

دو تا ابزار که این سؤال‌ها رو جواب می‌دن: یکی Waza و skill-validator هستن که می‌شه به صورت مستقل یا توی پایپ‌لاین CI/CD ازشون استفاده کرد.

در مورد این دوتا اینجا نوشتم؛ اگر دوست داشتید بخونید :)

🔗 [[لینک مطلب]](https://mesbahi.net/fa/blog/1405/03/04/agent-skill-toolchain-waza-skill-validator/)