Мазмұнға өту
2024 ж. 16 там.·7 мин оқу

Шығыс жауаптарын модерациялау: сүзгілер мен екінші модельді қайда қою керек

Шығыс жауаптарын модерациялау чат, email және CRM ішіндегі тәуекелді мәтінді жіберіп алмауға көмектеседі. Ережелерді қайда қою, арна мен домен бойынша қалай бөлу және екінші шақыруды қашан қосу керегін қарастырамыз.

Шығыс жауаптарын модерациялау: сүзгілер мен екінші модельді қайда қою керек

Неге жалпы фильтр жеткіліксіз

Бір мәтіннің мағынасы оны адам қай жерде көретініне қарай өзгереді. Чатта күмәнді жауапты тез нақтылауға болады. Хатта сол мәтін компанияның ресми ұстанымы сияқты көрінеді. CRM карточкасында ол тарихта сақталып қалады да, кейін басқа қызметкердің жұмысына әсер етеді.

Сондықтан тәуекел де өзгереді. Интернет-дүкен қолдауындағы қате көбіне тек клиенттің ашуын келтіреді және қосымша диалог тудырады. Банк, сақтандыру немесе медицинадағы қате шағымға, ішкі тексеруге немесе адамға тікелей зиян келтіруге дейін апаруы мүмкін.

Жалпы фильтр әдетте жауапты бір мәтін түрі ретінде қарайды. Оған оның чатқа, email-ге немесе ішкі жүйеге кеткені бәрібір. Басында бұл ыңғайлы, бірақ кейін кедергі болады. Мұндай фильтр қауіп төмен арналарда пайдалы сөйлемдерді қиып тастайды да, қателік бағасы жоғары жерде қауіпті тіркестерді өткізіп жібереді.

Жақсы мысал - уәделер мен ұсыныстар. Чатта «біз бұл мәселені бүгін міндетті түрде шешеміз» деген фраза оператордың сәтсіз айтылған сөзі ғана болуы мүмкін. Хатта ол енді міндеттеме сияқты көрінеді. Банк немесе медицина сценарийінде мұндай сенімділік деректер тексерілмей тұрып клиентке мүлде жетпеуі керек.

Тағы бір мәселе бар. Жалпы фильтр көбіне тек дөрекі нәрсені ұстайды: токсиканы, анық тыйымдарды, жеке деректердің ағып кетуін. Ал нақты тәуекел көбіне доменнің ұсақ детальдарында жасырынып тұрады. Банк үшін бұл керек ескертусіз берілген өнім туралы кеңес болуы мүмкін. Клиника үшін - диагнозға ұқсайтын ишара. CRM үшін - құрғақ фактінің орнына клиентке берілген артық баға болуы мүмкін.

Бір шек пен бір ереже жиыны әдетте екі жаққа да ауытқу береді. Команда қауіпсіз арналарда жалған срабатываниелерге тап болады, модерацияға ашуланады да, оны айналып өтудің жолын іздейді. Ал қауіпті жауаптар қатаң тексеру керек жерде өтіп кетеді.

Егер жүйе бірыңғай LLM API шлюзі арқылы жұмыс істесе, шығуда бір ғана тексеру қою азғыруы ерекше күшті болады. Интеграция шынымен жеңілдейді. Бірақ жұмыс істейтін схема әдетте басқаша: арна жауаптың пішінін анықтайды, ал домен - тәуекел деңгейі мен тексеру тереңдігін.

Жауап тізбегінде фильтрлерді қайда қою керек

Соңындағы бір фильтр көбіне тым кеш қосылады. Ол уақытқа дейін жауап шаблондардан, деректерді орнына қоюдан, мәтінді қысқартудан және арнаға лайықтаудан өтіп үлгереді. Тәуекел әр қадамда өседі, сондықтан тексеру бір нүктеде тұрмауы керек, тізбек бойымен жүруі тиіс.

Модельден кейін бірден оның черновигін тексеру керек. Осы сәтте қауіпті кеңестерді, жеке деректердің шығып кетуін, токсикалық тонды немесе сіздің нұсқауларыңызды айналып өтуді ұстау ең оңай. Жүйе мәселені ерте байқаса, қайта генерация сұрай алады, жауапты жеңілдете алады немесе диалогты операторға бере алады.

Клиент түзетусіз көретін өрістерге бөлек назар керек. Әдетте бұлар - email тақырыбы, push пен SMS үшін қысқа мәтін, қолтаңба, CTA батырмасы немесе сыртқы жүйеге кететін дайын JSON. Дәл осындай бөліктерді көбіне ешкім қолмен оқымайды, сондықтан оларға арналған ережелер ішкі черновикке қарағанда қатаңырақ болуы керек.

Жұмыс істейтін схема әдетте былай көрінеді: алдымен жүйе модельдің шикі жауабын генерациядан кейін бірден тексереді, содан кейін сыртқа сол күйі кететін финал өрістерін бөлек қарайды, ал арнаға жіберердің алдында құрастырылған хабарламаны тұтастай тексереді. Егер жауап блокталса, жүйе себебін, ереже нөмірін және оқиға болған кезеңді сақтауы керек.

Жіберердің дәл алдындағы соңғы тексеру черновик таза болған кезде де керек. Себебі кейін жауапқа клиенттің аты, тапсырыс нөмірі, CRM-нен алынған дерек немесе білім базасынан келген фрагмент қосылуы мүмкін. Модель мәтіні қауіпсіз еді, ал соңғы хат немесе чат хабары енді ондай емес.

Қарапайым мысал - банк қолдауы. Модель бейтарап жауап шығарды, бірақ шаблон кейін хатқа картаның толық нөмірін қосып қойды. Ерте фильтр мұны көрмес еді, өйткені нөмір әлі жоқ болатын. Канал алдындағы соңғы тексеру мәселені байқап, жіберуді тоқтатады.

Журналдар есеп беру үшін емес. Олар жүйені баптау үшін керек. Егер команда бір ереже хат тақырыптарын жиі бөгейтінін, ал екіншісі тек чатта іске қосылатынын көрсе, бүкіл саясатты қайта жазбай-ақ, нақты проблемалы жерді жөндей алады.

Ережелерді арна бойынша қалай бөлу керек

Бір жауапты барлық арнаға бірдей тексеруге болмайды. Чаттағы қысқа реплика, клиентке жіберілетін хат және CRM жазбасы әртүрлі ортада өмір сүреді, демек олардың тәуекелі де әртүрлі. Егер бір жалпы фильтр қалса, ол не артық нәрсені өткізіп жібереді, не пайдалы жауаптарды қиып тастайды.

Чатта әдетте үш нәрсе маңызды: тон, ұзындық және артық деталь. Жауап сабырлы болуы керек, қатқыл тіркестерсіз және клиент сұрамаған ұзақ түсіндірмелерсіз. Егер бот ішкі тексеру қадамдарын, жүйе лимиттерін немесе бөтен кейстердің детальдарын тізе бастаса, ондай жауапты тоқтатып, қысқартқан дұрыс.

Email үшін ережелер қатаңырақ. Хат ұзақ оқылады, оны компания ішінде қайта жібереді және жиі бизнес атынан берілген уәде ретінде қабылдайды. Сондықтан тек токсика мен деректердің ағуын емес, мерзімдер, кепілдіктер, жеңілдіктер, өтемақылар және міндеттемелер туралы тіркестерді де тексеріңіз. «Біз бұл мәселені бүгін міндетті түрде шешеміз» деген фраза чатта онша байқалмауы мүмкін, ал хатта тез арада проблемаға айналады.

CRM үшін міндет басқа. Онда клиентке арналған әдемі жауап керек емес, бірақ ішкі белгілерді, артық жеке деректерді және қызметкердің жорамалынын қалдыруға болмайды. Егер модель «клиент, шамасы, ашулы» деп жазса немесе толық құжат нөмірін «соңғы төрт цифр» жеткілікті болатын жерге көшірсе, ондай мәтінді жазбадан тазартқан дұрыс.

Ережелерді арналар бойынша бір матрицада ұстаған ыңғайлы. Чатқа ұзындық лимитін, рұқсат етілген тонды және артық детальға тыйымды қойыңыз. Email үшін уәде, мерзім және заң тұрғысынан сезімтал тіркестерді тексеруді қосыңыз. CRM үшін ішкі комментарийлерді алып тастауды және жеке деректерді барынша азайтуды енгізіңіз. Жүйе нені өзі түзете алатынын, ал нені қолмен тексеруге жіберу керегін сол жерде шешіп қойыңыз.

Қарапайым мысал. Банк қолдауындағы бот клиентке даулы транзакция туралы жауап береді. Чатта ол қысқа жазады: сұрау қабылданғанын растайды да, қайтарудың нақты мерзімін атамайды. Email-де сол мағына жеке тексеруден өтеді, онда шешім уақыты туралы кез келген уәде алынып тасталады. CRM-де тек клиенттің артық детальсыз қысқа қызметтік жазбасы сақталады.

Ережелер матрицасын әр сервиске бөліп-бөліп енгізбей, бір жерде сақтаған дұрыс. Сонда команда не үшін чат бір нәрсені, email екінші нәрсені, ал CRM үшіншісін кесетінін түсінеді. Егер трафик қазірдің өзінде бірыңғай шлюз арқылы өтсе, мұндай матрицаны маршруттар, логтар және тексеру баптауларымен қатар ұстау ыңғайлы.

Ережелерді домен бойынша қалай бөлу керек

Бір жауап SaaS үшін қауіпсіз, ал банк немесе клиника үшін жарамсыз болуы мүмкін. Сондықтан шығыс жауаптарды тексеру бір жалпы фильтр ретінде емес, домендік саясаттар жиыны ретінде жақсы жұмыс істейді. Әйтпесе модель бәріне тым құрғақ сөйлейді немесе сезімтал сценарийлерде жіберуге болмайтын нәрсені өткізіп жібереді.

Бастау үшін кемінде төрт доменге бөлек ереже жинаңыз: банк, медицина, ритейл және SaaS. Оларды бір ұзын тізімге араластырмаңыз. Ережелер бөлек жатқанда, команда жауап неге өткенін немесе неге бұғатталғанын тезірек түсінеді.

Банк үшін фильтр ставкалар, мерзімдер, айыппұлдар, лимиттер және келісімшарт шарттары туралы уәделерді қатаңырақ тексеруі тиіс. Медицинада ол диагнозға, емдеу схемасына немесе дәрігердің орнына берілген кеңеске ұқсайтын мәтінді бірден алып тастауы керек. Ритейлде әдетте баға, қолжетімділік, қайтару және жеткізу шарттары маңызды. SaaS-та тәуекел көбіне төменірек, сондықтан егер жауап өнім жасамайтын нәрсені уәде етпесе, техникалық детальды көбірек қалдыруға болады.

Мұнда пайдалы ереже қарапайым: тақырыпты емес, әрекет түрін тыйымдаңыз. «Сотқа жүгініп, мына соманы талап етіңіз» деген фраза әңгіме интернет-дүкен қолдауынан басталса да, қазірдің өзінде заңдық нұсқау сияқты. «Дозаны екі есе көбейтіңіз» деген фраза кез келген медициналық сценарийде, тіпті қолданушы өзі қыңырлық танытса да, қабылданбайды.

Тек сөздерді емес, жауап құрылымын да тексеріңіз. Қателер көбіне терминдерде емес, сан мен уәденің байланысында жасырынады. Егер модель сома, мерзім, пайыз, айыппұл немесе күн жазса, валидатор олардың нақты нені білдіретінін түсінуі керек. Әйтпесе «айыппұл 0%, мерзім 90 күн» деген жауап бейтарап мәтін сияқты өтіп кетуі мүмкін, ал шын мәнінде бұл дерлік шарттық талап.

Домендік ережелерді төрт жазықтықта берген ыңғайлы: қандай тұжырымдарға мүлде тыйым салынады, қандай сандар мен мерзімдерді бөлек салыстыру керек, қаншалықты нақтылыққа рұқсат етіледі және қашан жауап тікелей кеңес берудің орнына адамды диалогқа шақыруы тиіс.

Деталь деңгейін де доменге қарай бөлу керек. Банк үшін клиент дерегі расталмаған жағдайда нақты уәде бермей, жалпы процедураны беру жақсы. Медицинада анықтамалық ақпаратпен шектеліп, дәрігерге жүгінуге кеңес берген дұрыс. Ритейлде актуалды қалдық пен қайтару ережелері болса, дәлірек жауап беруге болады. SaaS-та қадамдық нұсқаулықтар, API мысалдары және қателерді талдау әдетте рұқсат етіледі.

Егер сіз LLM ағынын бірыңғай шлюз арқылы құрсаңыз, домендік саясаттарды маршрутизация және логтармен қатар ұстау ыңғайлы. Сонда команда қай модель жауап шығарғанын, қай ереже іске қосылғанын және мәтіннің қай кезеңде тәуекелді болғанын көреді.

Екінші модель қашан керек

Қазақстан талаптарына сай тексерулерді жинаңыз
Деректерді ел ішінде сақтап, маңызды жерде аудит жүргізіңіз.

Екінші шақыру жауаптағы қате 300-800 мс қосымша кідіріс пен тағы бір сұраудан қымбатырақ тұратын жерде керек. Әдетте бұл банк, медицина, сақтандыру, мемлекеттік сервистер және B2B-қолдау сияқты клиентке берілетін жауаптар, өйткені бір сөйлем жалған кеңес беріп, жеке деректерді ашып немесе ішкі ережені бұзып жіберуі мүмкін. Чаттағы қарапайым FAQ үшін мұндай қабат көбіне артық. Шарттары бар хат үшін - жоқ.

Көп команда екінші модельді тым ерте қойып, одан «бәрін тексеруді» сұрайды. Сонда ол мағынамен дауласа бастайды, шу ұстайды да, ағынды тежейді. Оған нақты тәуекелді тауып, белгі қайтару сияқты тар міндет берген әлдеқайда дұрыс. Мысалы: «PII», «медициналық кеңес», «жеңілдік уәдесі ережеден тыс», «қолмен тексеру керек». Кейде қысқа себеп пен іске қосқан мәтін фрагментін де қайтару пайдалы.

Ең жаман жұмыс істейтін схема - екінші модель жауапты шаблонсыз өзі «дұрыс етіп» қайта жазуы тиіс жағдай. Мұндай режимде ол мағынаны оңай өзгертіп, ескертпе ойлап тауып, тонды бұзады. Егер автоматты түзетуші керек болса, оған қатаң шекара беріңіз: нені өзгертуге болады, нені болмайды, қандай шаблон міндетті және қандай өрістер өзгеріссіз қалуы тиіс.

Екінші модель әдетте төрт жағдайда ақталады: жауап тәуекелі жоғары арнаға кетсе, домен сезімтал болса, негізгі модель ұзақ жауаптарда қатаң ережені ұстап тұра алмаса және бұрын қарапайым ереже жиыны ұстай алмаған инциденттер тарихы болса.

Күмәнді жағдайларды толық автоматқа бермеген дұрыс. Егер модель сенімсіз болса, бүкіл ағынды қиып тастағанша, адамға белгі бергені жақсы. Бұл жалған блоктауларды айтарлықтай азайтады. Тәжірибеде жиі жауаптардың 1-5%-ын ғана қолмен тексеруге жіберу жеткілікті.

Егер трафик қазірдің өзінде шлюз арқылы өтсе, мұндай қадамды бөлек шақыруға шығарған ыңғайлы: бір модель жауап жазады, екіншісі оны тәуекелдердің тар тізімі бойынша тексереді. Сонда тексеруші модельді бағаға, жылдамдыққа немесе доменге қарай өзгертіп, қолданбаның негізгі логикасын қозғамайсыз.

Тексеру ағынын қадам-қадаммен қалай жинау керек

Схема бір жалпы фильтрге емес, шешімдер кестесіне ұқсағанда ғана жұмыс істейді. Шығыс жауаптар үшін бұл әсіресе байқалады: бір мәтінді қолдау чатында өткізуге болады, бірақ клиентке хат жіберердің алдында кідірту керек.

Нақты тәуекелдерден бастаңыз, абстрактылы категориялардан емес. Әдетте 5-10 тармақ жеткілікті: жеке деректердің ағуы, қауіпті кеңес, компания атынан берілген уәде, токсикалық тон, қате сома, тыйым салынған контент, заң тұрғысынан тәуекелі бар тұжырымдар.

Содан кейін әр тәуекелге контекст беріңіз. Ол қай жерде қауіпті: чатта, email-де, дауыстық арнада немесе CRM комментарийінде ме? Қай доменде ол критикалық: қаржы, медицина, қайтарым, HR, мемлекеттік қызметтер? Достық чаттағы тапсырыс мәртебесі туралы қате мен кредит лимиті туралы хаттағы қате - бірдей деңгей емес.

Одан кейін жүйенің әрекетін тағайындаңыз. Әр ереженің бір түсінікті нәтижесі болуы керек: жауапты өткізу, фрагментті қайта жазу, мәтіннің бір бөлігін жасыру немесе қолмен тексеруге жіберу. Егер ережеде айқын басымдықсыз екі не үш нұсқа болса, команда продакшенде-ақ таласа бастайды.

Кішкентай матрица былай көрінуі мүмкін:

  • Қолдау чатындағы PII - бүркемелеу және жіберу
  • Email-дегі PII - бұғаттау және операторға беру
  • Міндетті ескертусіз қаржылық кеңес - қайта жазу
  • Модель сенімі төмен кезде сенімді жауап - қолмен тексеру

Сосын ағынды ескі диалогтар мен хаттарда сынап көріңіз. Тек жақсы мысалдарды алмаңыз. Модель қатқыл сөйлеген, қайтару саясатын шатастырған немесе клиент туралы артық деталь қосқан күмәнді кейстер керек. Осындай жинақта қай ереже үндемей тұрғаны, қайсысы тым көп кесіп тастағаны бірден көрінеді.

Шекті тек жалған срабатываниелерді талдағаннан кейін ғана көтеріңіз. Әйтпесе сіз фильтрді жұмсартасыз, бірақ оның нақты нені ұстайтынын түсінбейсіз. Пайдалысы - үш топты бөлек қарау: бекер бұғатталатын нәрсе, бекер өтетін нәрсе және екінші модель пайдасыз қайта жазатын нәрсе.

Егер жауаптар бірыңғай шлюз арқылы өтсе, ортақ тексерулерді бір жерде ұстаған ыңғайлы: PII бүркемелеу, аудит логтар және базалық шектеулер. Бірақ арна мен домен ережелерін бәрібір бөлек сақтаған дұрыс. Сонда чат email шектеулерін мұра етіп алмайды, ал банк сценарийлері ритейлге кедергі жасамайды.

Чат пен хаттағы тәуекелдің айырмасы бар мысал

Тексерулерді бір шлюзге жинаңыз
AI Router маршруттарды, аудит журналдарын және PII-ді бүркемелеуді бір жерде ұстап тұруға көмектеседі.

Бір жауап чатта рұқсат етілген, ал хатта қауіпті болуы мүмкін. Банктегі клиент тез жауап күтеді, сондықтан оператор не бот бірнеше секунд ішінде жауап береді. Хат ұзақ өмір сүреді, оны қайта жібереді де, кейін оны ресми мәтін ретінде талдайды.

Мынадай сұрауды елестетіңіз: клиент банк неге өтінішін мақұлдамағанын сұрайды. Базалық модель пайдалы болғысы келеді де, сыпайы жазып тұрып, «мүмкін, жүйе ішкі скоринг бойынша жоғары кредит тәуекелін көрді» деген сияқты сөйлем қосады. Формалды түрде бұл ұқыпты естіледі. Іс жүзінде - бас тарту себебі туралы болжам.

Мұндай жауапты жалпы фильтрмен ғана емес, домен деңгейінде кескен дұрыс. Банктік сценарийлерге арналған домендік фильтр скоринг, ішкі ережелер, антифрод және лимиттер туралы кез келген жорамалды, егер жүйе оны тексерілген дереккөзден алмаса, алып тастауы тиіс. Әйтпесе модель тез арада нанымды түсіндірмелер ойлап таба бастайды.

Одан кейін арна фильтрі іске қосылады. Чат үшін ол жауапты артық детальсыз екі қысқа сөйлемге дейін қысқартады. Email үшін сәл көбірек мәтін қалдыруға болады: бас тарту туралы жалпы тұжырым, ішкі параметрлер ашылмайтыны жөнінде қауіпсіз түсіндіру және клиент үшін түсінікті келесі қадам.

Мұндағы ағын қарапайым: базалық модель жауаптың черновигін дайындайды, домендік фильтр скоринг туралы жорамалды алып тастайды, арна фильтрі мәтінді чатқа немесе хатқа лайық қысқартады, ал екінші тексеру моделі банк бермеуі тиіс уәделерді іздейді.

Бұл жерде екінші модель сән үшін емес. Ол «деректерді нақтылағаннан кейін шешімді қайта қараймыз» немесе «бас тартуды тексерістен кейін тез қайтаруға болады» сияқты фразаларды ұстайды. Бірінші модель себепті ойдан шығармаған күннің өзінде, қолдауда жоқ құқыққа сүйенетін уәде айтып қоюы мүмкін.

Соңында чат қысқа жауап алады: банк өтінішті тексерудің ішкі параметрлерін ашпайды, бірақ клиент келесі қадамдар үшін қолдау қызметіне жүгіне алады. Хатта мәтін сәл кеңірек болуы мүмкін, бірақ болжамсыз және қайта қарау уәдесінсіз.

Егер сіз мұндай модерацияны аудит логтары бар шлюз арқылы құрсаңыз, түзетудің себебін сақтаған пайдалы. Журналға тура былай жазған дұрыс: «бас тартудың расталмаған себебі алынды», «жауап чатқа қысқартылды», «қайта қарау туралы уәде алынды». Кейін командаға модель қай жерде жиі қателесетінін және қай ережені өзгерту керегін түсіну оңайырақ болады.

Командалар жиі қай жерде қателеседі

Көбіне командалар модерацияны күрделі кейстерде емес, базалық баптауда бұзады. Олар бір универсалды тексеруші промпт алып, соның арқылы бәрін өткізеді: чат, email, жеке кабинет, ішкі құрал. Шығыс жауаптар үшін бұл жаман идея, өйткені тәуекел адам мәтінді қай жерде көретініне және кейін не істейтініне байланысты.

Егер бір API шлюзі арқылы әртүрлі өнімдер мен арналар өтсе, қате тез қымбатқа түседі. Чатта модельден жауапты 10 секундтан кейін нақтылап сұрауға болады. Клиентке хат ұзақ өмір сүреді, оны қайта жібереді, ал дауды кейін заңгер немесе сапа қызметі талдайды.

Ең жиі жіберілетін қателер қарапайым. Команда барлық арнаға бірдей тексеруші промпт қояды, ал тірі чатта деталь сұрауды өтінетін жұмсақ әрі толық емес жауап рұқсат етілуі мүмкін, бірақ хатта дәл сол мәтін уәде сияқты көрінеді. Немесе бір тізімге қауіпсіздік, тон, бизнес тыйымдары, заң талабы және редактураны араластырады. Сонда тексеруші модель басымдықтарды шатастырып, стильдік майда нәрсені үлкен тәуекел ретінде бөгеп тастайды.

Тағы бір типтік қате - мәселе тек бір жолда тұрса да, бүкіл жауапты кесу. Егер модель абайсызда PII-дің бір бөлігін ашып қойса немесе уәде бар артық сөйлем қосса, жүйені көбіне нақты фрагментті бүркемелеуге, өшіруге немесе қайта жазуға үйреткен дұрыс. Толық блоктау бүкіл жауап қате жорамалға құрылған жерде қажет.

Керісінше ауытқу да болады. Команда модельдің өз промптына тым сеніп, шаблондар мен деректерді орнына қоюдан кейінгі соңғы тексеруді ұмытады. Нәтижесінде черновик фильтрден өтеді, ал тәуекел соңғы қадамда пайда болады: хатқа клиенттің аты, келісімшарт нөмірі немесе міндеттеме сияқты естілетін тіркес қосылып кетеді.

Тағы бір жиі сәтсіздік: ережелер бірнеше адамның басында ғана өмір сүреді, жүйе конфигурациясында емес. Трафик аз кезде бұл байқалмайды. Арна мен команда көбейген сайын хаос басталады: бір сервис мерзімдерді кеседі, екіншісі оларды өткізіп жібереді, үшіншісі тіпті бұғаттау себебін жазбайды.

Іске қосар алдындағы қысқа тексеру

PII-ді жібермей тұрып тексеріңіз
Жеке деректерді арнаға жіберер алдында бүркемелеп, срабатывание себебін журналда сақтаңыз.

Алғашқы релиз алдында жауап сапасын ғана емес, жіберер алдындағы соңғы бөгетті де тексеріңіз. Командалар көбіне модерацияны модельдің жанына қойып, сонымен тынышталады. Бұл тым ерте: хат шаблоны, білім базасынан алынған кірістіру немесе постөңдеу бірінші тексеруден кейін-ақ жаңа тәуекел қосуы мүмкін.

Іске қосар алдында бір кездесуде-ақ өтіп шығуға және логтарда оңай тексеруге болатын қысқа тізім пайдалы:

  • Соңғы тексеру клиентке жіберердің дәл алдында тұрады. Одан кейін арна мәтінді өзгертпейді.
  • Модерация канал мен доменді бөлек өрістер ретінде алады. Ол оларды промпттан, бот атынан немесе жауап мәтінінен болжай алмайды.
  • Жүйе бұғаттау себебін, ереже ID-сын және іске қосқан жауап фрагментін жазады.
  • Команда әр арна мен домен бойынша түзетулердің, бұғаттаулардың және қолмен қараулардың үлесін көреді.
  • Күмәнді жағдайлар клиентке емес, қолмен тексеру кезегіне кетеді.

Бұл ұсақ нәрсе сияқты көрінеді, бірақ жүйе көбіне дәл осындай детальдардан бұзылады. Бір мәтін қолдау чатында жарамды болуы, ал хатта жарамсыз болуы мүмкін. Банкте чаттағы қысқа нақтылау өтуі мүмкін, ал шығатын хатта сол мағына уәде, жеке дерек немесе кеңеске ұқсайтын тұжырым салдарынан қатаңырақ ережені қажет етеді.

Бақылауды тек бұғаттаулардың өзінен ғана көрмеңіз. Егер олар өте аз, ал қолмен қараулар тым көп болса, жүйе күмәнді жауаптарды шамадан тыс алға өткізіп жатыр. Егер түзетулер тым көп болса, фильтрлер тон мен мағынаны бұза бастайды, мұны пайдаланушылар тез байқайды.

Егер кемінде бір тармақ қазірше команданың чатындағы келісімге сүйеніп тұрса, ал сұрау өрісінде және лог жазбасында нақты ереже жоқ болса, іске қосу әлі шикі. Мұндағы қате әдетте бір күндік қосымша тексеруге қарағанда қымбатырақ.

Кейін не істеу керек

Егер жүйе қазірдің өзінде клиенттерге жауап беріп жатса, барлық тәуекелді бірден жабуға тырыспаңыз. Бір арна мен бір доменді алыңыз, онда қате әдеттегіден қымбатқа түседі. Мысалы, банк үшін қолдау чаты немесе медициналық ұсынымдары бар хаттар. Сонда сіз тірі ақауларды тез көресіз: артық сенімділік, тыйымды өткізіп жіберу, қате тон, жеке деректердің ағуы.

Жақсы алғашқы қадам қарапайым. Тәуекелі байқалатын бір сценарийді таңдаңыз, бұзуға болмайтын 5-10 ережені жазыңыз, барлық іске қосулардың логын қосыңыз және күмәнді жауаптарды қолмен белгілеуді енгізіңіз, содан кейін соңғы 2-4 аптадағы нақты мысалдарда ағынды сынап көріңіз.

Егер сізде бірнеше модель болса, генерация мен тексерулерді бір маршрутта ұстаңыз. Әйтпесе команда бақылауды тез жоғалтады: бір модель жауап жазады, екіншісі бөлек proxy-дің ар жағында тұрады, үшіншісі басқа ортада тексереді. Кейін логика қай жерде бұзылғанын, кідіріс неге өскенін және қай провайдер күмәнді нәтиже бергенін түсіну қиын болады.

Қазақстандағы командалар үшін мұндай контурды AI Router және api.airouter.kz endpoint арқылы жинау ыңғайлы: қолданыстағы SDK, код және промпттарды дерлік өзгертпей қалдыруға болады, ал маршрутизацияны, аудит-логтарды және PII бүркемелеуді бір жерге шоғырландыруға болады. Бұл әсіресе деректерді ел ішінде сақтау және даулы кейстерді журнал бойынша талдау маңызды болғанда пайдалы.

Ережелер бастапқы күйінде ұзақ тұрмайды. Басында орынды көрінген нәрсе бір айдан кейін не пайдалы жауаптарға кедергі жасайды, не жаңа қате түрін өткізіп жібереді. Сондықтан ережелерді сезімге емес, инциденттерге қарап қайта қараңыз. Айына бір рет журналды ашып, қайталанатын жағдайларды жинаңыз да, үш нәрсені шешіңіз: нені алып тастау, нені нақтылау және нені екінші тексеруге көшіру.

Егер алдағы екі аптаға қарапайым жоспар керек болса, ол мынадай: алдымен бір арнаға базалық фильтрлерді қосыңыз, содан кейін домендік ережелерді енгізіңіз, одан кейін күмәнді жауаптарды қолмен тексеруге жіберіңіз. Бір типтегі қателер жиілегенін көрсеңіз, сол кезде ғана екінші тексеру моделін қосыңыз. Мұндай тәртіп әдетте уақытты үнемдейді және өнімді басында бұзбайды.

Жиі қойылатын сұрақтар

Неге бір ғана жалпы фильтр көбіне жеткіліксіз?

Өйткені жауаптың мәні арнаға қарай өзгереді. Чатта күмәнді сөйлемді бірден нақтылауға болады, ал хатта сол мәтін компанияның ұстанымы сияқты көрінеді. Бір жалпы фильтр әдетте тепе-теңдікті бұзады: бір жерде артық нәрсені қиып тастайды, басқа жерде тәуекелді өткізіп жібереді.

Жауап тізбегінде фильтрлерді қай жерге қойған дұрыс?

Тексеруді кемінде үш нүктеде қойған дұрыс: черновик модельден шыққан сәтте, хат тақырыбы немесе CTA сияқты өрістер құрастырылғаннан кейін және жіберердің дәл алдында. Сонда сіз тәуекелді әрі модель мәтінінен, әрі кейін шаблондар немесе CRM қосқан деректерден ұстайсыз.

Клиентке жіберер алдында соңғы тексеру не үшін керек?

Өйткені қауіпті бөлік көбіне соңында пайда болады. Модель қауіпсіз мәтін жазуы мүмкін, ал шаблон кейін клиенттің атын, келісімшарт нөмірін немесе тым сенімді тұжырымды қосады. Соңғы тексеру мұндай жағдайларды жібермей тоқтатады.

Чатқа арналған ережелер email үшін ережелерден несімен өзгеше?

Чатта әдетте қысқа, сабырлы тон және артық детальдың болмауы маңызды. Email үшін ережелер қатаңырақ: онда уәделерді, мерзімдерді, жеңілдіктерді, өтемақыларды және компанияның міндеттемесіне ұқсайтын тіркестерді бөлек ұстау керек.

CRM жазбаларында нені бөлек тексеру керек?

CRM-де әдемі жауап емес, құрғақ факт сақталғаны дұрыс. Қызметкердің жорамалдарын, ішкі белгілерді және артық жеке деректерді алып тастаңыз. Егер құжаттың не картаның соңғы төрт цифры жеткілікті болса, толық мәнін сақтамаңыз.

Ережелерді домен бойынша қалай бөлу керек?

Саясаттарды нақты тәуекелге қарай бөліңіз. Банк үшін ставкаларды, мерзімдерді, лимиттерді және айыппұлдарды қатаңырақ тексеріңіз; медицинада диагноз бен емдеу схемаларын алып тастаңыз; ритейлде баға, қайтару және жеткізуге назар аударыңыз; SaaS-та өнім ондай уәде бермесе, техникалық детальды көбірек қалдыруға болады.

Екінші модель қашан шынымен қажет?

Екінші модельді қате қымбатқа түсетін жерде қосыңыз. Әдетте бұл банк, медицина, сақтандыру, мемлекеттік сервистер және сезімтал шарттары бар хаттар. Чаттағы қарапайым FAQ үшін мұндай қабат көбіне керек емес.

Екінші модельдің өзі жауапты қайта жазуы керек пе?

Оған толық еркіндік бермеген дұрыс. Ол нақты тәуекелді тауып, PII, уәде немесе қолмен тексеру сияқты белгі қайтарсын. Егер сіз одан жауапты қатты шектеусіз қайта жазуды сұрасаңыз, ол мағынаны оңай өзгертіп, тонды бұзады.

Жалған блоктауларды қалай азайтып, пайдалы жауаптарды бұзбауға болады?

Алдымен ережелер санын түсінікті әрекеттерге дейін қысқартып, қателері бар ескі диалогтарды талдаңыз. Сосын күмәнді жағдайларды бүкіл ағынды кесіп тастағанша, адамға жіберіңіз. Ережелер арна мен доменге байланған болса, әдетте қолмен тексерудің аз үлесі жеткілікті.

Мұндай модерацияның алғашқы релизі алдында нені тексеру керек?

Іске қосар алдында үш нәрсені тексеріңіз: модерация канал мен доменді бөлек өрістер ретінде алады, соңғы тексеру жіберудің дәл алдында тұрады, ал логтар іске қосылу себебі мен мәтін фрагментін сақтайды. Егер осының біреуі болса да тек команданың ауызша келісіміне сүйенсе, жүйені алдымен нақты ережеге дейін жеткізген дұрыс.