🧪 کیفیتسنجی AI Agent Skillها
اگر با مفهوم و ساختار skill آشنا نیستین، پیشتر در موردش نوشتم (مقدمهای بر Skills، مهارتآموزی AI برای توسعه نرمافزار)
دیگه Skill خوب نوشتن، مثل خوب کد نوشتن، یکی از معیارهای برنامهنویس خوب بود شده. گاهی فکر میکنم صرف نوشتن یه Agent Skill همه چیز تمومه؛ در حالی که اینطور نیست و معلوم نیست اسکیلی که نوشتیم چقدر خوب کار میکنه و شاید حتی استفاده نشه یا برای مدل، بدآموزی داشته باشه! طی یک سال گذشته، به جز کدریویو، من کلی اسکیلریویو هم کردم و قبل از این ابزارها، که توی این مطلب معرفی خواهم کرد؛ ابزارهای داخلی برای تیم توسعه دادیم چون بنچمارکهایی که روی کدبیسهای بزرگ داشتم نشون میده که مدلهای AI و ابزارهای مختلف، خیلی به کیفیت و ساختار اسکیل اهمیت میدن (یا به بیان بهتر ازش اثرپذیری دارن). ولی الان ابزارهای کدبازی مثل waza یا skill validator هستن که در مورد کیفیت اسکیلها بررسی انجام میدن و اگر از AI استفاده میکنین؛ استفاده ازشون حیاتی به نظر میاد.
مثلا شاید بگین ساختار و spec رو رعایت کردم؛ ولی لینکهات سالمن؟ token budget رو رعایت کردی؟ روی Claude و GPT هر دو یهجور رفتار میکنه؟ agent واقعاً میدونه کِی باید این skill رو استفاده کنه؟
دو تا ابزار که این سؤالها رو جواب میدن: یکی Waza و skill-validator هستن که میشه به صورت مستقل یا توی پایپلاین CI/CD ازشون استفاده کرد.
در مورد این دوتا اینجا نوشتم؛ اگر دوست داشتید بخونید :)
🔗 [[لینک مطلب]](https://mesbahi.net/fa/blog/1405/03/04/agent-skill-toolchain-waza-skill-validator/)