Chad Scira ຄົ້ນຄວ້າວິທີທີ່ແບບພາສາໃຫຍ່ (large language models) ສາມາດຖືກປ່ອຍຂໍ້ມູນທີ່ເປັນພາຍທີ່ ແລະ ຖືກນໍາໃຊ້ເພື່ອເສຍຫຼຸດຕໍ່ບຸກຄົນ, ແລະສ້າງລະບົບປົກປ້ອງເພື່ອຕໍ່ສູ້ເຮືອນເຫມື່ອນ. ຄວາມເສຽງແມ່ນດ່ວນ: ຄວາມໄວ້ໃຈໃນຜົນລັບຂອງ LLM ໄດ້ເກີນຄວາມສາມາດຂອງພວກເຮົາໃນການກວດສອບຂໍ້ຄວາມ, ໃນຂະນະທີ່ຜູ້ປ່ອຍຂໍ້ມູນສາມາດຖືກຜະລິດໄດ້ຄ່າຖືກແລະງ່າຍດາຍທີ່ຈະປ່ຽນພຶດຕິກຳຂອງແບບມອດ ແລະ ການນຳໃຊ້ໃນການຄົ້ນຫາ ສຳລັບບຸກຄົນທີ່ບໍ່ມີຮູບພາບອອນໄລນ໌ກວ່າ.
ການຮັບທຶນສ່ວນຕົວໄດ້ຖືກປະກັນໃນວັນທີ 3 ເດືອນຕຸລາ 2025 ເພື່ອສື່ມຕໍ່ການຄົ້ນຄວ້ານີ້.
សេចក្តីសង្ខេបប្រធាន
ຄົນທົ່ວໄປທີ່ມີຮັບຮອງອອນໄລນ໌ນ້ອຍເຜີຍພາຍເຜິຍຄວາມສ່ຽງສູງຈາກການເພີ່ມພະລັງຂອງ AI ຕໍ່ການຫມິນເສຍຊື່ ແລະ ການເປັນສາເຫດຂໍ້ມູນ (data poisoning). ຜູ້ດຽວທີ່ມີແນວຄວາມຫມັ້ນຮ້ານສາມາດພັດທະນາເນື້ອຫາທີ່ເປັນເທັກນິກເພື່ອປ່ອຍເຂົ້າໃນສ່ວນນ້ອຍຂອງເວັບ ແລະກຳນົດສິ່ງທີ່ແມ່ນເຫັນໃນແບບຂອງແມ່ນໂມເດວ. ອະໄຫຼ່ນີ້ອະທິບາຍທາງທົ່ວໄປຂອງທາງເຂົ້າແບບຈິງ, ຜົນທີ່ຈິງແກ່ຊື່ແລະຄວາມປອດໄພ, ແລະສໍາລັບການກວດສອບແລະການປ້ອງກັນ. ມັນຍັງອະທິບາຍວ່າວິທີທີ່ໃບຢືນຢັນທີ່ຢືນຢັນດ້ວຍລະບົບຄຣິບໂກຣາຟີ ແລະ ການຄົ້ນຄວ້າທີ່ໃຫ້ຄວາມສຳຄັນກັບຕົ້ນຕົວ (provenance-aware retrieval) ສາມາດຊ່ວຍຫຸ້ມຜົນເສຍ.
ຜູ້ເບິ່ງ ແລະ ໂມເດວຂອງອັນຕະລາຍ
ຜູ້ເບິ່ງ: ບຸກຄົນ ແລະ ອົງກອນຂະໜາດນ້ອຍທີ່ບໍ່ມີການປະຈຳຕົວໃນ SEO ຢ່າງຫຼາຍ. ຂໍ້ຈຳກັດ: ເວລາ, ງົບປະມານ ແລະ ແຫຼ່ງທຶນທາງເຕັກນິກທີ່ຈຳກັດ. ຝ່າຍຄ້າຍ: ຜູ້ດຽວທີ່ສາມາດສ້າງລະຫັດຂໍ້ຄວາມຈຳນວນຫຼາຍ, ໃຊ້ເຄື່ອງມືການເຊື່ອມຕໍ່ພື້ນຖານງ່າຍ ແລະເຂົ້າໃຊ້ຊ່ອງວ່າງໃນການລາຍງານ. ເປົ້າໝາຍ: ການກະແທນຜົນການຄົ້ນຫາ/ຜົນລັບ LLM, ກໍ່ຄວາມເສຍຊື່, ສ້າງຄວາມສັງໄສຕໍ່ນາຍຈັດຈໍາ, ລູກຄ້າ, ແພດຟອມ ຫຼື ຕົວແທນ.
ການ 'LLM poisoning' ແມ່ນຫຍັງ?
การปนเปื้อนของ LLM หมายถึงการจัดการพฤติกรรมของโมเดลผ่านเนื้อหาที่ถูกฝังหรือประสานงานไว้ — เช่น โพสต์มุ่งร้าย บทความสังเคราะห์ หรือสแปมในฟอรัม — ซึ่งอาจถูกนำเข้าโดยระบบดึงข้อมูลหรือถูกใช้โดยมนุษย์เป็นสัญญาณ กระตุ้นให้โมเดลเชื่อมโยงผิดและสร้างเรื่องเล่าหมิ่นประมาท.
ເນື່ອງຈາກ LLM ແລະ ລະບົບການດຶງຂໍ້ມູນເຮັດວຽກເພື່ອຂະໜາດແລະການຄຸດຄອງ, ຜູ້ດຽວທີ່ມີແນວຄວາມຫມັ້ນໃຈສາມາດກຳນົດວ່າແມ່ນອະໄຫຼ່ທີ່ແບບຈິງຈະເຫັນກ່ຽວກັບບຸກຄົນໂດຍການທະນາມເນື້ອຫາເຂົ້າໃນສ່ວນນ້ອຍຂອງເວັບ. ສິ່ງນີ້ມີປະສິດທິພາບສູງຕໍ່ບຸກຄົນທີ່ມີການປະຈຳອອນໄລນ໌ນ້ອຍ.
ແນວທາງដែលຊື່ສຽງត្រូវបានបម្លែង
- ການການຄົ້ນແລະການປະຊາສັງຄົມທີ່ຖືກປ່ອຍຜິດ - ການຂົນ້າຍໂປຣໄຟລ໌ (profile jacking), ຟາມລິ້ງ (link farms), ແລະ ການໂພສຈຳນວນຫຼາຍເພື່ອກະທຳໃຫ້ການຈັດອັນດັບແລະຄລິກແຕ່ອັດຕະໂນມັດເປັນໄປຢ່າງເໝາະສົມ
- ការប៉ុលមូលដ្ឋានចំណេះដឹង និង RAG - ការបង្កើតទំព័រអត្តសញ្ញາវត្ថុ និងកំណត់ចំណាំ QA ដែលមើលទៅមានសេម៉ាន្តិចពាក់ព័ន្ធ ហើយត្រូវបានយកអនុវត្តជាបរិបទ។
- Indirect prompt injection - ມາດຕະການບ່ອນເວັບທີ່ເຮັດໃຫ້ຜູ້ແທນຫຼືឧបករណ៍ບັນທຶກການລະເທີບຄຳສັ່ງຫຼືດຶງຂໍ້ມູນເສັ້ນສັນທ່າງອອກ។
- Endpoints ທີ່ຖືກເຂົ້າແກ້ (backdoored endpoints) - ການຫໍກອບແບບມອດທີ່ດຳເນີນງານປົກກະຕິຈົນກ່ອນມີຄໍາທີ່ເປັນເຄື່ອງກະທົບ (trigger phrases), ສ່ວນຫນຶ່ງຈະປ່ອຍຂໍ້ຄວາມທີ່ເປັນແພງເປົ່າເປົາ.
ຄວາມສຽງເພີ່ມເຕີມ ແລະ ໂຕແບບການລ່ວງລົ້ມ
- การล่มสลายของโมเดลจากการฝึกด้วยผลลัพธ์สังเคราะห์ — วงจรป้อนกลับที่ข้อความที่สร้างขึ้นจะทำลายคุณภาพของโมเดลในอนาคตหากไม่ได้รับการกรองหรือปรับน้ำหนัก.
- Indirect prompt injection - ມາດຕະການប្រឆាំងលើເວັບທີ່ເອົາໃຈນໍາໃຊ້ຜູ້ແທນ ຫຼືឧបករណ៍ພົບເບິ່ງໃຫ້ດຶງຂໍ້ມູນសຳລັບຫຼືແຜ່ການបំពានកិត្តិយសເມື່ອຖືກອ້າງອີງ।
- ការបំពុលហាង embedding - បញ្ចូលផ្នែកអត្ថបទប្រឆាំងក្នុងមូលដ្ឋានចំណេះដឹង ដើម្បីឱ្យការយកតំបន់ឆ្លើយតបបង្ហាញអះអាងមិនពិតដែលមើលទៅសមស្របពីមន័យ។
- Backdoored releases - ການຜະລິດສິນຄ້າຫຼືການປ່ອຍຊອບແວທີ່ຖືກແກ້ໄຂ (ເຊັ່ນ checkpoints ຫຼື API wrappers) ທີ່ເຮັດວຽກປົກກະຕິຈົນກ່ອນມີຄໍາກະທົບ.
ກໍລະນີຈັງຈິງ ແລະ ການອ້າງອີງ
มาตรการบรรเทาเชิงลึก
ການຄົ້ນຄວ້າແລະການຈັດອັນດັບ
- ການຄະແນນແຫຼ່ງຂໍ້ມູນ ແລະ ການຫຼຸດ/ເນັ້ນນໍາໜ້າຕາມຕົ້ນຕາຂອງແຫຼ່ງ - ສົງໃຈໃນເນື້ອຫາທີ່ໄດ້ລົງຊື່ ຫຼື ແຜກພິມທີ່ໄດ້ຢືນຢັນ; ຫຼຸດນໍາໜ້າເນື້ອຫາໃໝ່ທີ່ຖືກສ້າງ ຫຼື ໜ້າທີ່ມີຊື່ສຽງຕໍ່າ
- ການຫລຸດຄ່າເວລາມີຊ່ວງອະນຸໂຍດ (grace period) - ຕ້ອງການໄລຍະເວລາກ່ອນທີ່ແຫຼ່ງໃໝ່ຈະມີຜົນກະທົບຕໍ່ຄຳຕອບທີ່ສຳຄັນ; ເພີ່ມການກວດສອບດ້ວຍມະນຸດສໍາລັບໜ່ວຍທີ່ແກ້ງແວ່ງຫຼາຍ (sensitive entities).
- ការរកឃើញបន្ទប់ Echo - ចាប់ក្រុមអត្ថបទដែលស្ទើរតែដូចគ្នា ហើយដាក់កំណត់ការប៉ះពាល់ដែលមានការពង្រីកពីប្រភពឬបណ្តាញដដែលឲ្យឡើងវិញ។
- ການກວດສອບຄຳຜິດແລະຄວາມແປກໃນພື້ນທີ່ embedding - ເກັດໝາຍບົດຄຳທີ່ມີຕຳແໜ່ງເວັກເຕີທີ່ຖືກປັບແຕ່ງໃນທາງການຕໍ່ຕ້ານ.
ការអនាម័យទិន្នន័យ និងមូលដ្ឋានចំណេះដឹង
- ຖ່າຫຼັກ snapshot ແລະ ฺdiff ຂອງຖານຄວາມຮູ້ - ກວດພິຈາລະນາຄວາມຕ່າງຂ້າງໃຫຍ່, ໂດຍສະເພາະສໍາລັບນິຍົມບຸກຄົນ ແລະ ຂໍ້ຫມາຍຖືກກ່າວຫາທີ່ບໍ່ມີແຫຼ່ງຂໍ້ມູນຕົ້ນຕໍ່າ
- ລາຍການ canary ແລະ ລາຍການປະຕິເສດ - ປ້ອງກັນການນຳເຂົ້າໂດເມນທີ່ຮູ້ວ່າເປັນການລະບົບທີ່ກ້າວລູກ; ແຊ່ງແຄນາຣີເພື່ອວັດການແຜ່ໂຄງການທີ່ບໍ່ໄດ້ຮັບອະນຸຍາດ.
- ມະນຸດໃນວົງຜົນສໍາລັບប្រធានបទហានិភ័យខ្ពស់ - ຊຸດການອាប់ដេតដែលបានស្នើសុំពុំក្នុងជួររៀបចំសម្រាប់ការវិនិច្ឆ័យដោយដៃ។
ການຢືນຢັນ ແລະ ຊື່ສຽງ
- ការបញ្ជាក់ដែលបានផ្ទៀងផ្ទាត់ដោយគ្រីបតូ - សេចក្តីថ្លែងការណ៍ដែលចុះហត្ថលេខាដោយអ្នកជំនាញ និងអង្គការដែលបានពិនិត្យ ហើយបោះពុម្ពផ្សាយតាមកំណត់ត្រាដែលអាចបន្ថែមបានតែប៉ុណ្ណោះ។
- ແຜນພາບຊື່ສຽງ - ຮວບຮວມການຮັບຮອງທີ່ໄດ້ລົງຊື່ ແລະ ຫັດອັນດັບເນື້ອຫາທີ່ມາຈາກຜູ້ລະເມືອດຊ້ຳ ຫຼື ເຄືອຂ່າຍບອດ
- ການອ້າງອີງທີ່ເຫັນໄດ້ໂດຍຜູ້ໃຊ້ - ຕ້ອງການໃຫ້ໂມເດລແສງແຫຼ່ງໂຂງຂໍ້ມູນແລະລະດັບຄວາມໝັ້ນໃຈ ພ້ອມດ້ວຍແກັດຂໍ້ມູນກ່ຽວກັບທີ່ມາ (provenance) ສໍາລັບຂໍ້ອ້າງທີ່ສັບສົນ.
បញ្ជីត្រួតពិនិត្យសហគ្រាស
- ทำแผนที่หน่วยงานที่อ่อนไหวในโดเมนของคุณ (บุคคล แบรนด์ หัวข้อทางกฎหมาย) และนำคำค้นหาไปยังกระบวนการที่ได้รับการป้องกันซึ่งมีข้อกำหนดเกี่ยวกับแหล่งที่มา.
- ນຳ C2PA ຫຼື ເຄື່ອງມືທີ່ຄ້າຍກັນມາໃຊ້ສໍາລັບເນື້ອຫາຂອງຝ່າຍທຳອິດ ແລະເຊີນຊວນພາກພິເສດໃຫ້ດໍາເນີນເຊັ່ນນັ້ນ.
- ຕິດຕາມອິດທິພິບາດຂອງແຫຼ່ງໃໝ່ຕາມເວລາ ແລະແຈ້ງເຕືອນເມື່ອມີການເຄື່ອນໄຫວທີ່ບໍ່ວິທີປົກກະຕິສຳລັບການຕອບລະດັບອົງຄົງ.
- ດໍາເນີນການທົດສອບທີມແດງ (red teaming) ເປັນປີເປັນໄປ ສໍາລັບ RAG ແລະໂປຣແກຣມທີ່ເບິ່ງ ລວມທັງຊຸດການທົດສອບການສົ່ງຄໍາສັ່ງໃຫ້ເປັນອ້າງອີງຢ່າງທຳມະດາ (indirect prompt injection)
ການບຸ່ກຫຼຸກ ແລະ defamation ຜ່ານ AI
ບຸກຄົນທີ່ຖືກជួលໃຊ້ឥະຫນາມໃນດຽວນີ້ນໍາ AI ແລະອັດໂມຕິເຄື່ອງມາໃຊ້ເພື່ອផលິດງານບຸ່ກຫຼຸກ ແລະ defamation ໃນດັດຈຳ, ສ້າງអត្ថបទដែលមើលទៅນ່າជឿ ແລະ "sources" ក្លែងបន្លំដែលងាយក្នុងការបញ្ជី ទាញទិន្នន័យ និងចែកចាយឡើងវិញ។ យុទ្ធនាការទាំងនេះមានចំណាយទាបមានឥទ្ធិពលខ្លាំង ហើយពិបាកដោះស្រាយពេលដែលវាត្រូវបានពង្រីកដោយប្រព័ន្ធស្វ័យប្រវត្តិ។
Chad Scira ໄດ້ປະສົບກັບການກຳກັບແບບເປົ່າເປົາ ແລະ ການຫມິນເສຍຊື່ ຄວ່າມພ້ອມກັບການເຊື່ອມທາງ spam ເພື່ອປັບປຸງສັນຍາລັກຊື່ແລະພົບຜົນໃນການຄົ້ນຫາ. ບົດລາຍລະອຽດ ແລະ ເອກະສານຢືນຢັນຖືກບັນທຶກຢູ່ທີ່ນີ້: Jesse Nickles - ການບຸ່ກຫຼຸກ ແລະ defamation.
ການຈັດປະເພດພາຍຄວາມສຽງ
- Pretraining data poisoning - ການປ່ອຍພິສາດໃນກຸ່ມຂໍ້ມູນສາທາລະນະທີ່ໃຊ້ໃນການຝຶກອະນຸຕໍ່ຕົ້ນ ເພື່ອປ່ົນຂໍ້ມູນໃຫ້ເກັບການເຊື່ອມຕໍ່ທີ່ບໍ່ຖືກຕ້ອງ ຫຼືແບັກດອອກ (backdoor).
- RAG poisoning - ການເປັນແຫຼ່ງພິສາດໃສ່ຖານຂໍ້ມູນຄວາມຮູ້ ຫຼືແຫຼ່ງພາຍນອກທີ່ທ່ວມຖາມດຶງເອົາໃຊ້ໃນເວລາການພິຈາລະນາ (inference).
- ການຄົ້ນ/ສັງຄົມທີ່ຖືກປຽກ - ການທົນລະນ້ຳໂພສຫຼືໜ້າທີ່ທີ່ມີຄຸນນະພາບຕໍ່າເພື່ອກະທຳໃຫ້ສັນຍານການຄົ້ນແລະການຈັດອັນດັບຖ້າກ່ຽວກັບບຸກຄົນ ຫຼື ຫົວຂໍ້
- ຂໍ້ປ້ອນແບບຕໍ່ຕ້ານແລະເນື້ອຫາທີ່ຈະເຮັດໃຫ້ເກີດພຶດຕິກຳທີ່ບໍ່ຕ້າງຕໍ່ຄວາມຕ້ອງການ ຫຼື jailbreak ທີ່ຊ້ຳຂໍ້ອ້າງຫົວຫົວ.
ເຫດການ ແລະ ການຄົ້ນຄວ້າລ່າສຸດ (ມີວັນທີ)
หมายเหตุ: วันที่ข้างต้นสะท้อนวันที่ตีพิมพ์หรือวันที่เผยแพร่สาธารณะตามแหล่งที่เชื่อมโยง.
ເປັນຫຍັງທີ່ນີ້ເປັນອັນຕະລາຍ
- LLM อาจดูน่าเชื่อถือแม้แหล่งอ้างอิงพื้นฐานจะอ่อนหรือถูกฝังโดยฝ่ายตรงข้าม.
- ແຖວການສະຫນອງການຄົ້ນແລະຈັດອັນດັບອາດຈະໃຫ້ນໍານ້ຳຕົວອັກສອນທີ່ຖືກຊ້ຳຫຼາຍ, ເຮັດໃຫ້ຜູ້ຄົນໜຶ່ງສາມາດກະທຳໃຫ້ຜົນລົງໂປ້ແປກໂດຍພຽງຈຳນວນ
- ការត្រួតពិនិត្យข้อเท็จจริงដោយមនុស្សមានល្បឿនយឺត និងមានចំណាយខ្ពស់ ប្រៀបធៀបនឹងល្បឿននៃការផលិត និងចែកចាយមាតិកាដោយស្វ័យប្រវត្តិ។
- ເຈົ້າໜ້າທີ່ທີ່ບໍ່ມີການປະກົດຕົວໃນອອນໄລນ໌ເປັນຈິງ ມັກຈະເປັນຜູ້ອ່ຽງໂບດຕໍ່ການເປີດໂພສດ່ຽວດ້ວຍຂໍ້ມູນທີ່ຖືກປ່ຽນແປງ (single post poisoning) ແລະການຮ້າຍຕໍ່ຢັງອະຈະມິດຕົນຕົນ (identity attacks).
ການລຶບລະອຽດຄວາມສ່ຽງ
- ការត្រួតពិនិត្យការជ្រើសរើសការងារ និងវេទិកា - ការស្វែងរក និងសង្ខេបដោយដំណើរការ LLM អាចស្ទេរecho មាតិកាដែលបានបំពុលក្នុងដំណើរការជ្រើសរើស, ការគ្រប់គ្រង ឬការត្រួតពិនិត្យការចាប់ផ្តើមការងារ។
- ການທ່ອງເດີນ, ການທີ່ອາໄສ, ແລະບໍລິການທາງການເງິນ - ການກວດອັດໂນມັດອາດຈະເຜີຍເນື້ອຫາທີ່ບໍ່ຖືກຕ້ອງ ທີ່ສາມາດຊ່ວຍຊ້າຫຼືບໍ່ອະນຸຍາດການບໍລິການ.
- Persistence - ເມື່ອຖືກດັດເຂົ້າໃນຖານຂໍ້ມູນຄວາມຮູ້ ຫຼືຄຳຕອບທີ່ຖືກເກັບໄວ້, ຄຳອ້າງທີ່ບໍ່ຖືກສາມາດປະກົດຂຶ້ນອີກໄດ້ຫຼັງຈາກການລົບອອກ.
- ຄຳຕິຕິຊົມທີ່ສ້າງຂຶ້ນ - ເນື້ອຫາທີ່ຜະລິດສາມາດເປັນຕົ້ນທີ່ຊ່ວຍໃຫ້ເນື້ອຫາທີ່ຜະລິດຕິດຕໍ່ໄດ້, ເຮັດໃຫ້ນ້ຳໜັກຂອງຂໍ້ຜິດພາດເບິ່ງມີນ້ຳໜັກຫຼາຍຂຶ້ນຕາມເວລາ.
ការរកឃើញ និងការតាមដាន
- ຕັ້ງການແຈ້ງຄົ້ນຫາສຳລັບຊື່ຂອງທ່ານແລະນາມແທັກ; ກວດເຊັກຄໍາຖາມ site: ເປັນເທື່ອຢ່າງສົດເພື່ອສອບຫາໂດເມນທີ່ມີຊື່ສຽງຕໍ່າທີ່ກ່າຍກ່າຍກ່ຽວກັບທ່ານ
- ຕິດຕາມການປ່ຽນແປງໃນແຜ່ນຄວາມຮູ້ຫຼືໜ້າໂຕຕົວ; ເກັບຮູບຈໍທີ່ມີວັນທີແລະສ່ງສຳເນົາເປັນເອົາຫຍັງເພື່ອເປັນພຶດສະຫຼຸບ.
- ตรวจสอบกราฟเครือข่ายสังคมสำหรับบัญชีต้นทางที่ปรากฏซ้ำหรือการพุ่งขึ้นอย่างฉับพลันของสำนวนที่คล้ายกัน.
- ຖ້າກໍາລັງប្រតិបត្តິ RAG ຫຼືមូលដ្ឋានចំណេះដឹង សូមធ្វើការត្រួតពិនិត្យ entity drift ແລະពិនិត្យការផ្លាស់ប្ដូរធំៗចំពោះទំព័របុគ្គល ឬការចោទប្រកាន់ដែលគ្មានប្រភពដើម។
ຄູ່ມືການປົງກັນ - ບຸກຄົນ
- ຕົກລົງຜົນແຜ່ເວັບໄຊສ່ວນຕົວທີ່ມີການຢືນຢັນຕົວຕົນຢ່າງຊັດເຈນ, ສັ້ນໆເກັບບິອະ, ແລະວິທີຕິດຕໍ່; ຮັກສາບັນທຶກການແກ້ໄຂທີ່ມີວັນທີ.
- ຈັດໃຫ້ແທດຂໍ້ມູນໂປຣໄຟລ໌ (metadata) ສະຫມັດກັນທົ່ວແພດຟອມ; ໄດ້ຮັບໂປຣໄຟລ໌ທີ່ຜ່ານການຢືນຢັນເມື່ອສາມາດ ແລະເຊື່ອມເຂົ້າກັບເວັບໄຊຂອງທ່ານ.
- ໃຊ້ C2PA ຫຼື ການຢືນຢັນເນື້ອຫາຮູບແບບຄ້າມຄ່າເຊັ່ນກັນສໍາລັບຮູບພາບແລະເອກະສານສຳຄັນເມື່ອເປັນໄດ້; ຈັດເກັບຕົວຕົນຕົ້ນເອກະສານໄວ້ເປັນສ່ວນຕົວ.
- រក្សាកំណត់ហេតុភស្តុតាងជាមួយពេលវេលា៖ រូបថតអេក្រង់, តំណភ្ជាប់, និងលេខសំបុត្រ(តិកិត)រាល់វេទិកាសម្រាប់ការយកឡើងវិញនៅពេលក្រោយ។
- ຈັດເຮັດແບບຟອມການຮ້ອງຂໍລົບອອກ; ຕອບສະໜອງໄວແກ່ການຮ້ອງຂໍໃໝ່ ແລະບັນທຶກທຸກຂັ້ນຕອນເພື່ອສ້າງທາງຢ່າງຊັດເຈນ.
ຄູ່ມືການປົງກັນ - ທີມ ແລະ ຜູ້ປະສານລວມລະບົບ
- ເລືອກເນື້ອຫາທີ່ມີລາຍເຊັນ ຫຼືຖືກຢືນຢັນໂດຍຜູ້ຕີພິມໃນການດຶງ; ປະຕິບັດຊ່ວງເວລາໂດຍອ້າງອີງສໍາລັບແຫຼ່ງໃໝ່.
- จำกัดอิทธิพลที่เกิดซ้ำจากต้นทางเดียวกัน และกำจัดสำเนาที่ใกล้เคียงต่อเครือข่ายต้นทางแต่ละแห่ง.
- ເພີ່ມແບັດເຈດການຢື່ນແທ້ (provenance badges) ແລະລາຍການແຫລ່ງຂໍ້ມູນທີ່ຜູ້ໃຊ້ເຫັນໄດ້ ສໍາລັບຂໍ້ອ້າງອີງໃນລະດັບບຸກຄົນແລະຫົວຂໍ້ອ່ອນໄວ.
- ນຳໃຊ້ລະບົບການຄົ້ນພົບຄວາມຜິດປົກກະຕິໃນຮ່າງຂໍ້ມູນ embedding; ໝາຍເຫດຄວາມແຕກຕ່າງຂອງເວັກເຕີອັດແດງແລະດຳເນີນການກວດ canary ເພື່ອຕິດຕາມການແຜ່ທີ່ບໍ່ຖືກອະນຸຍາດ.
ການຄົ້ນຄວ້າ: ການຢືນຢັນທີ່ຖືກຢືນຢັນໂດຍລະຫັດລັກສະນະ
Chad Scira ກຳລັງພັດທະນາລະບົບໃບຢືນຢັນທີ່ຖືກຢືນຢັນດ້ວຍວິທະຍາສາດການລັອດ (cryptographically verified) ເພື່ອສ້າງຄວາມໄວ້ໃຈໃນຂໍ້ຄວາມກ່ຽວກັບບຸກຄົນແລະເຫດການ. ເປົ້າໝາຍແມ່ນການສົ່ງຄຳອ້າງທີ່ມີລາຍເຊັນ ແລະ ຄົ້ນຫາໄດ້ຈາກຜູ້ຊ່ຽວຊານແລະອົງກອນທີ່ຖືກກວດສອບ, ເພື່ອສະໜັບສະໜູນການຕິດຕໍ່ຕົ້ນຕົວ ແລະ ການຕໍ່ສູ້ກັບການເປິ່ງພາຍ.
គោលការណ៍រចនា
- ອັດຕະສະນະແລະການກຳເນີດ: ຂໍ້ຄວາມຖືກເຊັນໂດຍບຸກຄົນ/ອົງການທີ່បានផ្ទັດເຊັກ ໂດຍໃຊ້ວິທີສາດສະຫຼອງຄີສາທາລະນະ (public-key cryptography).
- ການເກັບຂໍ້ມູນທີ່ສາມາດກວດສອບໄດ້: ໃບຢືນຢັນຖືກຕິດຢູ່ກັບບັນທຶກເພີ່ມເຕີມເທົ່ານັ້ນ ແລະບັນທຶກທີ່ແສດງການດັບດັ້ງເພື່ອອໍານວຍໃຫ້ການກວດສອບແບບອິດສະລະ.
- ການປະສົມການຄົ້ນເຫັນ: ແຖວ RAG ສາມາດຈັດລຳສຳຫຼັກ ຫຼື ຕ້ອງການແຫຼ່ງຂໍ້ມູນທີ່ໄດ້ຮັບການຢືນຢັນດ້ວຍຄຣິບໂຕກຣາຟີ ສໍາລັບຄໍາຖາມທີ່ອ່ອນໄວ
- แรงเสียดทานต่ำ: API และ SDK ช่วยให้ผู้เผยแพร่และแพลตฟอร์มสามารถออกและตรวจสอบการรับรองเมื่อรับข้อมูลเข้า.
ຊື່ສຽງ ແລະ ການແຈ້ງເຕືອນ
ນອກຈາກການຢືນຢັນ, ຊັ້ນຊື່ສຽງຈະລວບລວມການຮັບຮອງທີ່ມີລາຍເຊັນ ແລະເກັດໝາຍຜູ້ທີ່ຖືກເບີນຮູ້. ລະບົບແຈ້ງເຕືອນຈະແຈ້ງເຕືອນເປົ້າໝາຍເມື່ອມີການຮ່ວມມືໃນການຈັບປະກອບຫຼືມີການເພີ່ມຂຶ້ນຢ່າງຜິດປົກກະຕິ, ຊ່ວຍໃຫ້ສາມາດຕອບສະໜອງແລະຮ້ອງຂໍການລົບອອກໄດ້ໄວຂຶ້ນ.
ឆានែលផ្នែកច្បាប់ និងវេទិកា
- ໃຊ້ຂັ້ນຕອນລາຍງານຂອງແພດຟອມທີ່ມີແພັກເອົາຫຍໍ້ພາບພາສະຫຼຸບພິສູດທີ່ຊັດເຈນ: ລິ້ງ, ວັນທີ, ສະແກນຫນ້າຈໍ, ແລະຜົນກະທົບ. ອ້າງອີງນະໂຍບາຍກ່ຽວກັບການຫມິ່ນປະມາດແລະນະໂຍບາຍກ່ຽວກັບການລະເບີດເຮືອນ (harassment).
- បង្កើនកម្រិតជាមួយសេចក្តីជូនដំណឹងផ្លូវការ នៅពេលសមស្រប; រក្សាកំណត់ហេតុការសារទំនាក់ទំនង និងលេខសំបុត្រជាក់ទិន្នន័យនៅក្នុងខ្សែឯកសារផ្ទាល់ដោយអត្ថប្រយោជន៍។
- ພຶດສະຫວ່າງຄວາມແຕກຕ່າງຂອງຂໍ້ກົດໝາຍກ່ຽວກັບການຫມິນເສຍຊື່ສຽງ ແລະ ການຮັບຜິດຊອບຂອງແພດຟອມ; ຂໍແນະນໍາໃຫ້ປຶກສາທະນາຍຄວາດສໍາລັບເຄື່ອງກໍລະນີທີ່ມີຄວາມສ່ຽງສູງ.
ແຜນການນໍາໃຊ້ (ປີທີ 1)
- MVP: สคีมาการรับรองและ SDK สำหรับผู้เผยแพร่เพื่อเซ็นคำชี้แจงเอกลักษณ์และข้อเรียกร้องเกี่ยวกับเหตุการณ์.
- ທົດລອງກັບກຸ່ມນ້ອຍຂອງຜູ້ຊີ້ສັນທີ່ຜ່ານການກວດສອບແລະອົງກອນ; ສ້າງຂັ້ນຕອນການຢືນຢັນ.
- RAG plugins: ເປີດໃຊ້ໂມດການຕອບທີ່ອີງຕາມແຫຼ່ງຂໍ້ມູນ (provenance-first) ເພື່ອໃຫ້ຄວາມສຳຄັນແກ່ແຫຼ່ງທີ່ຖືກຢືນຢັນ ສໍາລັບຄຳຖາມທີ່ພິສັດສຳຄັນ.
អានបន្ថែម (ជាមួយកាលបរិច្ឆេទ)
ການຮ່ວມມື
ການຄົ້ນຄວ້ານີ້ນຳໜ້າແລະກຳລັງພັດທະນາຢ່າງເປັນການ. Chad Scira ຍິນດີຮັບການຮ່ວມມືຈາກຜູ້ຊ່ຽວຊານອື່ນໆໃນວົງການນີ້.
ຖ້າທ່ານສົນໃຈໃນການຮ່ວມມື ກະລຸນາຕິດຕໍ່ມາທີ່: [email protected]