Chad Scira ស្រាវជ្រាវពីរបៀបដែលម៉ូដែលភាសាធំពីរការបំពុលនិងការប្រើប្រាស់ក្នុងគោលបំណងប៉ះពាល់បុគ្គល ហើយកសាងប្រព័ន្ធការពារដើម្បីប្រឆាំងនឹងគ្រោះថ្នាក់ទាំងនេះ។ ហានិភ័យមានភាពបន្ទាន់៖ ល្បឿនក្នុងការទុកចិត្តលើលទ្ធផល LLM បានលើសសមត្ថភាពរបស់យើងក្នុងការផ្ទៀងផ្ទាត់សេចក្ដីថ្លែង ខណៈដែលអ្នកប្រឆាំងអាចផ្សាយអត្ថបទដោយថ្លៃថោកដែលបញ្ច្រាសឥរិយាបថម៉ូដែល និងទិដ្ឋភាពស្វែងរកចំពោះបុគ្គលដែលមានវត្តមានតិចលើអ៊ីនធឺណេត។
រង្វង់វិនិយោគឯកជនត្រូវបានសម្រេចនៅថ្ងៃទី 3 ខែតុលា 2025 ដើម្បីបន្តការស្រាវជ្រាវនេះ។
សេចក្តីសង្ខេបប្រតិបត្តិ
មនុស្សធម្មតាដែលមានសកម្មភាពតិចលើអ៊ីនធឺណេតប្រឈមនឹងហានិភ័យធំនៅពីក្រោយពីការគំរាមកំហែងដែលបានពង្រីកដោយ AI និងការបញ្ចូលទិន្នន័យពុល (data poisoning)। អ្នកម្នាក់ដែលមានបំណងអាចដាំរឿងរ៉ាវមិនពិតដែលការស្វែងរក ទំព័រសង្គម និងម៉ូដែលភាសាធំអាចធ្វើកំណត់ឡើងវិញ។ ឯកសារនេះពន្យល់ពីផ្លូវប្រហារមានទូទៅ លទ្ធផលជាក់ស្តែងលើកេរ្តិ៍ឈ្មោះ និងសុវត្ថិភាព និងសៀវភៅប្រតិបត្តិការយជាក់លាក់សម្រាប់ការរកឃើញ និងការការពារ។ វាក៏រៀបរាប់ពីរបៀបដែលការបញ្ជាក់ដែលបានផ្ទៀងផ្ទាត់ដោយគណិតវិទ្យាសម្ងាត់ និងការស្វែងយកដែលយល់ដឹងអំពីប្រភពអាចកាត់បន្ថយហានិភ័យសម្រាប់បុគ្គល និងអ្នកបញ្ចូលរួម។
អ្នកទស្សនា និងគំរូគំរាមកំហែង
អ្នកទស្សនា៖ បុគ្គល និងអង្គភាពតូចៗដែលមិនមានវត្តមាន SEO ធំ។ ការតូចចិត្ត៖ ពេលវេលាកំណត់ ថវិកា និងធនធានបច្ចេកទេសមានកំណត់។ ប្រឆាំង៖ តួអង្គម្នាក់ដែលអាចបង្កើត និងផ្សព្វផ្សាយអត្ថបទច្រើន ប្រើបណ្តាញតំណភ្ជាប់មូលដ្ឋាន និងអាណិតចំណុចខ្វះក្នុងប្រព័ន្ធរាយការណ៍។ គោលបំណង៖ បម្លែងលទ្ធផលស្វែងរក/ម៉ូដែលភាសាធំ (LLMs), ប៉ះពាល់កេរ្តិ៍ឈ្មោះ និងបង្កើតការសង្ស័យចំពោះនិយោជិក អតិថិជន វេទិកា ឬភ្នាក់ងារ។
ការពុល LLM គឺជាអ្វី?
ការបំពុល LLM មានន័យថា ការបង្កើតការបញ្ជួញឬបំពានលើអាកប្បកិរិយាម៉ូដែល តាមរយៈមាតិកាដែលបានដាំ ឬបានសម្របសម្រួល — ឧទាហរណ៍ ការបង្ហោះអាក្រក់ អត្ថបទសិប្បនិម្មិត ឬស្ពាមនៅក្នុងវេទិកា — ដែលអាចត្រូវបានទទួលដោយប្រព័ន្ធយកវិញ ឬត្រូវបានមនុស្សប្រើជាសញ្ញា បណ្ដាលឲ្យម៉ូដែលឈរសល់ទៅរកការភ្ជាប់ខុស និងសេចក្តីរាយការណ៍ប្រូប្បន្នភាព។
ដោយសារ LLMs និងប្រព័ន្ធស្វែងយកត្រូវបានធ្វើឲ្យមានប្រសិទ្ធភាពសម្រាប់ទំហំនិងការគ្របដណ្តប់ អ្នកប្រឆាំងម្នាក់អាចបង្កើតទ្រង់ទ្រាយអ្វីដែលម៉ូដែល “មើលឃើញ” អំពីនរណាម្នាក់ដោយការបញ្ចេញព័ត៌មានច្រើនលើផ្នែកតូចនៃបណ្តាញ។ វាពិសេសមានប្រសិទ្ធភាពចំពោះបុគ្គលដែលមានវត្តមានតិចលើអ៊ីនធឺណេត។
របៀបដែលកេរ្តិ៍ឈ្មោះត្រូវបានបម្រែបម្រួល
- ការបំពុលក្នុងការស្វែងរក និងបណ្តាញសង្គម — ការកាន់កាប់ប្រវត្តិ (profile jacking), ស្ថាប័នបង្កើតតំណ (link farms), និងការបង្ហោះជាច្រើន ដើម្បីប៉ះពាល់លក្ខណៈនៃចំណាត់ថ្នាក់ និងការបញ្ចូលស្វ័យប្រវត្តិ
- មូលដ្ឋានចំណេះដឹង និងការបំពុល RAG - បង្កើតទំព័រអង្គភាព និងកំណត់សម្គាល់ QA ដែលមើលទៅពាក់ព័ន្ធន័យ និងត្រូវបានយកមកប្រើជាបរិបទ។
- ការចាក់បញ្ចូលបញ្ជាដោយប្រយោល - មាតិកាអាក្រក់លើបណ្តាញដែលធ្វើឱ្យភ្នាក់ងារ ឬឧបករណ៍រុករកធ្វើតាមបញ្ជា ឬបញ្ចេញទិន្នន័យដែលមានភាពងាយរងគ្រោះ។
- ចំណុចចុងបញ្ចប់ដែលមានច្រកក្រោយ (Backdoored endpoints) - ជាស្រទាប់បិទម៉ូដែលអាក្រក់ដែលបង្ហាញជាធម្មតារហូតដល់មានពាក្យចាប់ (trigger phrases) ហើយបន្ទាប់មកបញ្ចេញព័ត៌មានមិនពិតដែលមានគោលដៅ។
ហានិភ័យបន្ថែម និងរបៀបបរាជ័យ
- ការធ្លាក់រលុងរបស់ម៉ូឌែលដោយសារការបណ្តុះលើលទ្ធផលសិប្បនិម្មិត — វដ្តមតិដែលអត្ថបទដែលបានបង្កើតធ្វើឲ្យគុណភាពម៉ូឌែលនៅពេលអនាគតធ្លាក់ទាក់ ប្រសិនបើមិនមានការរេងចម្រាញ់ ឬការផ្ដល់ទំងន់។
- ការចាក់បញ្ចូលបញ្ជាដោយប្រយោល (indirect prompt injection) - មាតិកាអាក្រក់លើបណ្តាញដែលបញ្ជាឱ្យភ្នាក់ងារ ឬឧបករណ៍រុករកដកយកព័ត៌មានសម្ងាត់ ឬផ្សព្វផ្សាយការបំពានកិត្តិយស ពេលមានការយោង។
- ការបំពុលឃ្លាំង embedding - បញ្ចូលកថាខណ្ឌប្រឆាំងទៅក្នុងមូលដ្ឋានចំណេះដឹង ដើម្បីឲ្យការទាញយកបង្ហាញអះអាងមិនពិតដែលមើលទៅសមនឹងអត្ថន័យ។
- ការចេញផ្សាយដែលមានច្រកក្រោយ (Backdoored releases) - ដាក់បង្ហាញពិន្ទុឈ្នួល (modified checkpoints) ឬស្រទាប់ API ដែលអនុវត្តដូចធម្មតារហូតដល់មានពាក្យចាប់។
វិធីសាស្រ្តកម្ចាត់ហានិភ័យជ្រៅ
ការទាញយក និងការដាក់ចំណាត់ថ្នាក់
- ការវាយតម្លៃប្រភព និងកំណត់ទម្ងន់ប្រភព — ផ្តល់អាទិភាពលើមាតិកាដែលបានចុះហត្ថលេខា ឬបានផ្ទៀងផ្ទាត់ដោយអ្នកបោះពុម្ពផ្សាយ; កាត់ទម្ងន់លើទំព័រថ្មីឬទំព័រមានកេរ្តិ៍ឈ្មោះទាប
- ការថយចុះតាមពេលវេលាជាមួយរយៈពេលអតិភាព — ទាមទារពេលស្នាក់មុនដែលប្រភពថ្មីៗអាចមានឥទ្ធិពលលើចម្លើយដែលមានផលប៉ះពាល់ខ្ពស់; បន្ថែមការត្រួតពិនិត្យដោយមនុស្សសម្រាប់អត្តសញ្ញាណឬអង្គភាពដែលសំងាម។
- ការរកឃើញ echo chamber - រៀបចំក្រុមប្រយោគដែលស្ទួនជាទៀងទាត់ ហើយកំណត់ការប្រែប្រួលឥទ្ធិពលដែលមកពីប្រភពឬបណ្ដាញដូចគ្នា។
- ការរកឃើញអ្នកនៅពីលើលក្ខណៈពិសេស និងអស្ចារ្យក្នុងដែន embedding - សម្គាល់អត្ថបទដែលទីតាំងវ៉ិចទ័ររបស់ពួកវាត្រូវបានអភិបាលបង្កប់សម្រាប់ប្រឆាំង។
ការថែទាំទិន្នន័យ និងមូលដ្ឋានចំណេះដឹង
- មូលដ្ឋានចំណេះដឹង Snapshot និង diff - ពិនិត្យការផ្លាស់ប្តូរធំៗ ជាពិសេសសម្រាប់អត្តសញ្ញាណមនុស្ស និងការចោទប្រកាន់ដែលគ្មានប្រភពដើម
- បញ្ជី Canary និងបញ្ជីហាម - ប្រយុទ្ធការរួមបញ្ចូលដែនដែលបានគេស្គាល់ថាអាចប្រើប្រាស់ដោយអាក្រក់; បញ្ចូល canary ដើម្បីវាស់ការបន្តពត៌មានដោយគ្មានការអនុញ្ញាត។
- មានមនុស្សនៅក្នុងដំណើរការ សម្រាប់ប្រធានបទដែលមានហានិភ័យខ្ពស់ - ដាក់ការអាប់ដេតដែលបានស្នើសុំទៅក្នុងជួរដើម្បីពិនិត្យ និងសម្រេចដោយដៃ។
ការបញ្ជាក់ និងកេរ្តិ៍ឈ្មោះ
- បញ្ជាក់ដែលបានផ្ទៀងផ្ទាត់ដោយវិធីគ្រីបតូក្រាហ្វី - សេចក្តីថ្លែងការណ៍ដែលចុះហត្ថលេខារួចពីអ្នកជំនាញ និងអង្គការដែលបានត្រួតពិនិត្យ ហើយបានបោះពុម្ពផ្សាយតាមកំណត់ត្រាដែលអាចបន្ថែមបានតែប៉ុណ្ណោះ។
- ក្រាហ្វកេរ្តិ៍ឈ្មោះ — សរុបការគាំទ្រដែលបានចុះហត្ថលេខា ហើយបន្ថយលំដាប់មាតិកាដែលបង្កឡើងដោយអ្នកប្រើប្រាស់ដែលរៀបចំអំពើម្តងហើយម្តងឬបណ្តាញរ៉ូបូត
- ឯកសារយោងសម្រាប់អ្នកប្រើ - ទាមទារឲ្យម៉ូឌែលបង្ហាញប្រភព និងកម្រិតទំនុកចិត្ត ដោយមានស្លាកបញ្ជាក់ប្រភពសម្រាប់ការអះអាងដែលមានភាពងាយរងគ្រោះ។
បញ្ជីពិនិត្យសម្រាប់សហគ្រាស
- រកគារប្រើប្រាស់អត្តសញ្ញាណដែលមានភាពទាក់ទាញក្នុងដែនរបស់អ្នក (បុគ្គល ម៉ាក ប្រធានបទផ្នែកច្បាប់) និងផ្ញើសំណួរទៅបណ្តាញដំណើរការដែលមានការការពារ និងមានតម្រូវការលម្អិតអំពីប្រភព។
- អនុម័ត C2PA ឬវិធានការផ្សេងក្លាយសម្រាប់កម្មសិទ្ធិមាតិកាពីភាគីទីមួយ ហើយលើកទឹកចិត្តដៃគូឲ្យធ្វើដូចគ្នា។
- តាមដានឥទ្ធិពលនៃប្រភពថ្មីៗតាមពេល និងផ្ញើព្រមានពេលមានការប្រែប្រួលមិនធម្មតាសម្រាប់ចម្លើយលំដាប់អត្តសញ្ញាណ។
- អនុវត្តកិច្ចប្រតិបត្តិការក្រុមក្រហមយ៉ាងបន្តសម្រាប់ភ្នាក់ងារ RAG និងភ្នាក់ងាររុករក រួមទាំងឈុតតេស្តសម្រាប់ការបញ្ចូលពាក្យបញ្ជាដោយផ្លូវត្រង់ខាងក្រៅ (indirect prompt injection)
ការរំខាន និងការបំពានកិត្តិយស ដោយបច្ចេកវិទ្យា AI
បុគ្គលសម្រាប់ជួលឥឡូវនេះប្រើប្រាស់ AI និងអូតូម៉ាស៊ីន ដើម្បីផលិតយ៉ាងច្រើននូវការរំខាន និងការបំពានកិត្តិយស ដោយបង្កើតអត្ថបទដែលមើលទៅសាកសម និង “ប្រភព” ក្លែងបន្លំដែលងាយសម្រាប់ធ្វើស៊ើបអង្កេត (index), ទាញ (scrape) និងចែកចាយឡើងវិញ។ ប្រយុទ្ធនានាទាំងនេះមានថ្លៃទាប ប៉ះពាល់ខ្លាំង ហើយពិបាកក្នុងការកែម្អក្រោយពេលបានពង្រីកដោយប្រព័ន្ធស្វ័យប្រវត្តិ។
Chad Scira បានជួបប្រទៈការរើសអើង និងការបំពានឈ្មោះដែលមានគោលដៅផ្ទាល់ខ្លួន ព្រមទាំងការតភ្ជាប់ស្ពេមដែលមានបំណងប្តូរទិន្នន័យសញ្ញាកេរ្តិ៍ឈ្មោះ និងទិដ្ឋភាពស្វែងរក។ សេចក្ដីរាយការណ៍លម្អិត និងខ្សែភស្តុតាងត្រូវបានចុះបញ្ជីនៅទីនេះ៖ Jesse Nickles - ការរំខាន និងការបំពានកិត្តិយស.
ចំណាត់ថ្នាក់គំរាម
- ការបំពុលទិន្នន័យមុនបណ្តុះបណ្តាល - ពុលសាសនាក្នុងរដ្ឋបណ្ណសាធារណៈដែលប្រើសម្រាប់ការបណ្តុះបណ្តាលដំបូង ដើម្បីបញ្ចូលការយោងដែលមិនពិត ឬទ្វារផ្ទុកចូលក្រោយ។
- ការបំពុល RAG - ការដាំពូជទៅក្នុងមូលដ្ឋានចំណេះដឹង ឬប្រភពខាងក្រៅដែលខ្សែបណ្ដាញទាញយកប្រើនៅពេលធ្វើការរំពឹងទុក (inference time)。
- ការបំពុលស្វែងរក/សង្គម - បញ្ចេញសារជាច្រើន ឬបង្កើតទំព័រមានគុណភាពទាប ដើម្បីប៉ះពាល់សញ្ញាទាញយក និងចំណាត់ថ្នាក់អំពីមនុស្សឬប្រធានបទ
- ពPrompt និងមាតិកាជា adversarial - ការរៀបចំបញ្ចូលដែលបណ្តាលឲ្យមានឥរិយាបថមិនចង់បាន ឬ jailbreaks ដែលទម្លាក់អះអាងដែលបន្ដបំពាន។
ព្រឹត្តិការណ៍ និងការស្រាវជ្រាវថ្មីៗ (មានកាលបរិច្ឆេទ)
សម្គាល់៖ កាលបរិច្ឆេទខាងលើបង្ហាញពីថ្ងៃចេញផ្សាយ ឬថ្ងៃដេញផ្សាយសាធារណៈនៅក្នុងប្រភពដែលភ្ជាប់។
ហេតុអ្វីបានជាអ្វីនេះគឺហានិភ័យ
- LLMs អាចបង្ហាញខ្លួនដូចជាមានអំណាចនិយាយបញ្ជាក់ ទោះបីយោងមូលដ្ឋានខ្សោយ ឬត្រូវបានដាំដោយគោលដៅប្រឆាំងក៏ដោយ។
- បណ្តាញដំណើរការទាញយក និងដាក់ចំណាត់ថ្នាក់អាចផ្តល់ទំងន់លើអត្ថបទដែលត្រូវបានធ្វើឡើងច្រើនដង ដូច្នេះអនុញ្ញាតឲ្យអ្នកដ៍តែម្នាក់អាចបត់បែនលទ្ធផលដោយផ្អែកលើបរិមាណតែប៉ុណ្ណោះ
- មធ្យោបាយត្រួតពិនិត្យតត្ថភាពដោយមនុស្សយឺត និងមានថ្លៃខ្ពស់ បើប្រៀបធៀបទៅនឹងល្បឿននៃការផលិត និងចែកចាយមាតិកាដោយស្វ័យប្រវត្តិ។
- ជនរងគ្រោះដែលមិនមានវត្តមានសំខាន់លើអនឡាញ ងាយរងគ្រោះយ៉ាងខ្លាំងចំពោះការពុលដោយប៉ុស្តិ៍តែមួយ និងការវាយប្រហារអត្តសញ្ញាណ។
ការវិភាគជ្រៅអំពីហានិភ័យ
- ការត្រួតពិនិត្យការជ្រើសរើសនិយោជិក និងវេទិកា - ការស្វែងរក និងសេចក្តីសង្ខេបដោយ LLM អាចលើកឡើងមាតិកាដែលបានបំពុលក្នុងពេលជ្រើសរើស ការត្រួតពិនិត្យ ឬពេលបណ្តុះបណ្តាលចូលធ្វើការ។
- សេវាកម្មការធ្វើដំណើរ ផ្ទះសម្បែង និងសេវាកម្មហិរញ្ញវត្ថុ - ការត្រួតពិនិត្យដោយស្វ័យប្រវត្តិអាចបញ្ជាក់អំពីរឿងរ៉ាវក្លែងបន្លំនានា ដែលអាចយឺតឬរាំងសង្គ្រោះការទទួលសេវា។
- ភាពស្ថិតស្ថេរ - ពេលដែលបានរាយបញ្ជីក្នុងមូលដ្ឋានចំណេះដឹង ឬចម្លើយដែលបានផ្ទុក (cached) អះអាងមិនពិតអាចរីកឡើងវិញទោះបីបានដកចេញរួចហើយ។
- មតិយោបល់សិប្បនិម្មិត - មាតិកាដែលបានបង្កើតអាចជួយចាប់ផ្តើមការបង្កើតមាតិកាបន្ថែម ហើយធ្វើឲ្យទម្ងន់បង្ហាញនៃព័ត៌មានមិនពិតកើនឡើងតាមពេលវេលា។
ការរកឃើញ និងការត្រួតពិនិត្យ
- កំណត់ការជូនដំណឹងស្វែងរកសម្រាប់ឈ្មោះ និងឈ្មោះផ្សេងៗរបស់អ្នក; ជាប្រចាំពិនិត្យសំណួរ site: សម្រាប់ដែនដែលមានកេរ្តិ៍ឈ្មោះទាបដែលបានរំលេចឈ្មោះរបស់អ្នក
- តាមដានការផ្លាស់ប្តូរទៅលើផ្ទាំងចំណេះដឹង ឬទំព័រអត្តសញ្ញាណរបស់អ្នក; រក្សារូបថតអេក្រង់ដែលមានកាលបរិច្ឆេទ និងចម្លងនាំចេញជាការសម្តែងភស្តុតាង។
- ត្រួតពិនិត្យក្រាបភ្ជាប់បណ្តាញសង្គមសម្រាប់គណនីដើមដែលមានការកើតឡើងម្តងទៀត ឬការកើនឡើងយ៉ាងភ្លាមៗនៃការប្រើប្រាស់វាក្យបញ្ជារដែលស្រដៀងគ្នា។
- បើលោកអ្នកកំពុងប្រតិបត្ដិ RAG ឬមូលដ្ឋានចំណេះដឹង សូមចាត់ឱយមានការត្រួតពិនិត្យការប្រែប្រួលអង្គភាព (entity drift) និងពិនិត្យការផ្លាស់ប្តូរធំៗទៅទំព័របុគ្គល ឬការចោទដែលគ្មានប្រភពដើម។
សៀវភៅយុទ្ធសាស្ត្រការពារ - សម្រាប់បុគ្គល
- ផ្សព្វផ្សាយវែបសាយផ្ទាល់ខ្លួនដែលមានការបញ្ជាក់អត្តសញ្ញាណយ៉ាងច្បាស់ ប្រវត្តិខ្លី និង វិធីទាក់ទង; រក្សាបញ្ជីកំណែដែលមានកាលបរិច្ឆេទ។
- សមកាលប្រវត្តិមេតាដាតាប្រើប្រាស់(profile metadata) ទូទាំងវេទិកា; ទទួលបានប្រវត្តិដែលបានផ្ទៀងផ្ទាត់នៅកន្លែងដែលអាចធ្វើបាន ហើយភ្ជាប់ពួកវាវិញទៅគេហទំព័ររបស់អ្នក។
- ប្រើក្រមសញ្ញាមាតិកា C2PA ឬវិញ្ញាបនប័ត្រដូចគ្នាសម្រាប់រូបភាព និងឯកសារសំខាន់នៅពេលអាចធ្វើបាន; រក្សាទុកច្បាប់ដើមជាឯកជន។
- រក្សាកំណត់ត្រាភស្តុតាងជាមួយពេលវេលា៖ ថតស្គ្រីនហ្សុត (screenshots), តំណភ្ជាប់ និងលេខសំបុត្រវេទិកា សម្រាប់ការលើកដំឡើងបន្តនៅពេលក្រោយ។
- រៀបចំពុម្ពសំណុំស្នើសុំដកចេញ; ឆ្លើយតបឲ្យរហ័សចំពោះការវាយប្រហារថ្មីៗ និងចុះបញ្ជីរាល់ជំហានសម្រាប់ខ្សែឯកសារដែលច្បាស់លាស់។
សៀវភៅយុទ្ធសាស្ត្រការពារ - សម្រាប់ក្រុម និងអ្នកបញ្ចូលប្រព័ន្ធ
- ចំណេញនូវមាតិការដែលបានចុះហត្ថលេខា ឬបានផ្ទៀងផ្ទាត់ដោយអ្នកបោះពុម្ពសម្រាប់ការទាញយក; អនុវត្តរយៈពេលពន្យារពេលផ្អែកលើពេលសម្រាប់ប្រភពថ្មី។
- កំណត់ឥទ្ធិពលដែលមានការកើតឡើងម្តងៗពីដើមដែនដូចគ្នា និងដកចម្លងស្រដៀងគ្នាជិតស្និតចេញសម្រាប់បណ្តាញដើមនីមួយៗ។
- បន្ថែមស្លាកប្រភព (provenance badges) និងបញ្ជីប្រភពដែលបង្ហាញដល់អ្នកប្រើ សម្រាប់អះអាងកម្រិតបុគ្គល និងប្រធានបទដែលមានភាពប្រៃសណីយ៍។
- អនុវត្តការរកឃើញអנומាលីលើឃ្លាំង embedding; សម្គាល់ adversarial vector outliers និងអនុវត្តតេស្ត canary សម្រាប់ការរីករាលដាលដែលមិនទទួលការអនុញ្ញាត។
ការស្រាវជ្រាវ៖ សេចក្ដីផ្ទៀងផ្ទាត់ដែលបានផ្ទៀងផ្ទាត់ដោយគ្រីបតូក្រាហ្វី
Chad Scira កំពុងសាងសង់ប្រព័ន្ធបញ្ជាក់ដែលបានផ្ទៀងផ្ទាត់ដោយគណិតវិទ្យាសម្ងាត់ ដើម្បីបង្កើតទំនុកចិត្តចំពោះសេចក្ដីថ្លែងអំពីមនុស្ស និងព្រឹត្តិការណ៍។ គោលដៅគឺផ្តល់ឲ្យ LLMs និងប្រព័ន្ធស្វែងយកនូវការអះអាងដែលបានចុះហត្ថលេខា និងអាចស្វែងរកបាន ពីអ្នកជំនាញ និងអង្គការដែលបានត្រួតពិនិត្យ ដើម្បីធានាប្រភពប្រការនិងកម្លាំងការពារចំពោះការបញ្ចូលទិន្នន័យពុល។
គោលការណ៍រចនា
- អត្តសញ្ញាណ និងប្រភពដើម៖ សេចក្តីថ្លែងការណ៍ត្រូវបានហត្ថលេខាដោយបុគ្គល/អង្គការដែលបានផ្ទៀងផ្ទាត់ ដោយប្រើការអ៊ិនគ្រីបដោយកូនសោសាធារណៈ។
- ការផ្ទុកដែលអាចបញ្ចាក់បាន៖ ការបញ្ជាក់ត្រូវបានភ្ជាប់ទៅកាន់កំណត់ហេតុដែលអាចបន្ថែមបានតែប៉ុណ្ណោះ និងបង្ហាញការប៉ះពាល់ដើម្បីអនុញ្ញាតការត្រួតពិនិត្យដោយឯករាជ្យ។
- ការរួមបញ្ចូលការទាញយក៖ បណ្តាញ RAG អាចផ្តល់អាទិភាព ឬទាមទារមូលដ្ឋានដែលបានផ្ទៀងផ្ទាត់ដោយគ្រីបតូសម្រាប់សំណួរមានចំនុចសំខាន់
- របារាការទៅតិចបំផុត៖ APIs និង SDKs អនុញ្ញាតឲ្យអ្នកផ្សាយ និងវេទិកាបញ្ចេញ និងពិនិត្យលិខិតបញ្ជាក់នៅពេលបញ្ចូលទិន្នន័យ។
កេរ្តិ៍ឈ្មោះ និងការជូនដំណឹង
ក្រៅពីការផ្តល់សក្ខីប័ត្រ ស្រទាប់កេរ្តិ៍ឈ្មោះធ្វើការប្រមួលការយល់ព្រមដែលបានចុះហត្ថលេខា និងសម្គាល់អ្នករំខានដែលគេស្គាល់។ ប្រព័ន្ធរាយការណ៍ជូនដំណឹងចំពោះគោលដៅនៅពេលដែលរកឃើញការវាយប្រហារដែលរួមគ្នា ឬការកើនឡើងអចលនា បានអនុញ្ញាតឲ្យមានការឆ្លើយតបឆាប់រហ័ស និងការស្នើសុំដកចេញ។
ឆានែលផ្លូវច្បាប់ និងវេទិកា
- ប្រើដំណើរការរាយការណ៍លើវេទិកាជាមួយកញ្ចប់ភស្តុតាងច្បាស់៖ តំណ, ថ្ងៃខែ, រូបថតអេក្រង់ និងផលប៉ះពាល់។ សូមយោងគោលនយោបាយស្តីពីការបំពានឈ្មោះ និងការរំខាន។
- អនុវត្តការលើកកម្ពស់ជាមួយសេចក្តីជូនដំណឹងផ្លូវការនៅពេលសមរម្យ; រក្សាកំណត់ត្រាសារប្រាស្រ័យ និងលេខសំបុត្រ (ticket IDs) ជាភស្តុតាង។
- ចាត់ទុកភាពខុសគ្នាតាម الاختصاص (jurisdiction) ក្នុងករណីបំពានកេរ្តិ៍ឈ្មោះ និងការទទួលខុសត្រូវរបស់វេទិកា; ពិគ្រោះមេធាវីសម្រាប់ករណីដែលមានហានិភ័យខ្ពស់។
ផែនការអនុវត្ត (ឆ្នាំទី 1)
- MVP: ស្កីម៉ាសញ្ញាបញ្ជាក់ និង SDK សម្រាប់អ្នកផ្សាយ សម្រាប់ចុះហត្ថលេខាលើប្រកាសអត្តសញ្ញាណ និងការអះអាងពីព្រឹត្តិការណ៍។
- ចាប់ផ្តើមជាកម្មវិធីសាកល្បងជាមួយក្រុមតូចនៃវិជ្ជាជីវៈ និងអង្គការដែលបានត្រួតពិនិត្យ; ស្ថាបនាប្រតិបត្តិការផ្ទៀងផ្ទាត់។
- RAG plug-ins៖ បើកម៉ូដចម្លើយដោយប្រភពជាមុន ដែលផ្តល់អាទិភាពដល់ប្រភពដែលបានផ្តល់សក្ខីប័ត្រសម្រាប់សំណួរមានលក្ខណៈទាន់សំខាន់/ទាក់ចិត្ត។
អានបន្ថែម (ជាមួយកាលបរិច្ឆេទ)
កិច្ចសហការ
ការស្រាវជ្រាវនេះទាន់សម័យ និងកំពុងអភិវឌ្ឍយ៉ាងសកម្ម។ លោក Chad Scira ស្វាគមន៍ការរួមគ្នាជាមួយអ្នកជំនាញផ្សេងទៀតក្នុងវិស័យនេះ។
បើអ្នកចាប់អារម្មណ៍ក្នុងការសហការ សូមទាក់ទងមកតាម: [email protected]