Nnyocha Mbibi LLM na Mgbochi Mmegbu
Chad Scira na-eme nchọpụta otu eji achafu ma jiri nnukwu ụdị asụsụ mee ihe iji merụọ ndị mmadụ, ma na-ewu usoro nchebe iji megide ihe ize ndụ ndị a. Ihe ize ndụ ahụ dị ngwa: ọsọ ntụkwasị obi nsonaazụ LLM agafeela ikike anyị iji nyochaa nkwupụta, ebe ndị iro nwere ike bipụta ederede n'ọnụ ala nke na-eme ka omume model na mmetụta ọchụchọ gbasara mmadụ nwee ntụpọ.
Enwetara nzọụkwụ itinye ego nkeonwe na 3 Ọktoba 2025 iji gaa n'ihu na nnyocha a.
Nchịkọta Isi
Ndị mmadụ nkịtị nwere obere akara na ịntanetị na-eche nnukwu ihe ize ndụ site na mmụba AI na-eme ka mmebi aha na ịchafu data nwee mmetụta. Otu onye nwere ebumnuche nwere ike tinye akụkọ ụgha nke ọchụchọ, ntanetị mmekọrịta, na LLM ga-eweghachi. Akwụkwọ a kọwara ụzọ mwakpo a na-ahụkarị, mmetụta doro anya na aha ọma na nchekwa, na usoro bara uru maka ịchọpụta na nchebe. Ọ na-akọwa otu atestashọn ndị e kwadoro site n'iji cryptography na ụzọ nchọta nke na-ewere mmalite ga-esi belata mmebi nye ndị mmadụ na ndị jikọtara.
Ndị na-ege ntị na Ihe nlereanya ize ndụ
Ndị na-ege ntị: ndị mmadụ na òtù nta na-enweghị nnukwu mbipụta SEO. Ihe mgbochi: oge pere mpe, ego pere mpe, na akụrụngwa teknụzụ pere mpe. Onye iro: otu onye nwere ike ịmepụta ma bipụta nnukwu ọnụọgụ ederede, jiri netwọkụ njikọ dị mfe, ma mee exploit na ebe a na-adịghị ahụ anya n'usoro ịkekọrịta akụkọ. Ebumnuche: mebie nsonaazụ ọchụchọ/LLM, merụọ aha ọma, mee ka ndị ọrụ, ndị ahịa, nyiwe, ma ọ bụ ndị nnọchi anya nwee obi abụọ.
Gịnị bụ 'LLM poisoning'?
Mbibi LLM pụtara ịgbanwe omume nlereanya site n'itinye ọdịnaya e tiri ma ọ bụ kwadoro ọnụ — dịka posts ọjọọ, edemede e kere eke, ma ọ bụ spam n'ụlọ mkparịta ụka — nke sistemụ nchịkọta ozi nwere ike iri ma ọ bụ mmadụ jiri dị ka akara, na-agbali ime ka nlereanya jikọta ihe n'ụzọ ụgha ma mepụta akụkọ na-emebi aha.
N'ihi na LLM na usoro nchọta na-emeziwanye maka ogo na mkpuchi, otu onye iro nwere ebumnuche nwere ike kee ihe model 'hụrụ' gbasara mmadụ site n'ịpụrụ akụkụ nta nke weebụ. Nke a na-arụ ọrụ nke ọma megide ndị nwere obere nnọchiteanya n'ịntanetị.
Otu esi emebi aha
- Nchọta na mmetọ mmekọrịta - izu ohi profaịlụ, link farms, na ịdebe ọtụtụ posts iji mebie atụmatụ ntinye n'usoro na njikọ autocomplete.
- Imịpụ ihe n'ime akụ ihe ọmụma na RAG - ịmepụta ibe njirimara na ndetu QA nke na-apụta dịka metụtara semantik ma a na-eweghachite ha dị ka ozi ndabere.
- Indirect prompt injection - ọdịnaya iro n'ịntanetị nke na-eme ka ndị nnọchiteanya nchọgharị meegharị ntuziaka ma ọ bụ wepụta data dị nzuzo.
- Backdoored endpoints - wrappers model ọjọọ nke na-eme ka ha dị nkịtị ruo mgbe okwu na-akpalite pụtara; mgbe ahụ ha na-ewepụta ụgha kpọmkwem.
Ihe ize ndụ ndị ọzọ na ụdị ọdịda
- Nsogbu ịda ụdị sitere n’ịzụ na mmepụta e kere eke - okirikiri nzaghachi ebe ederede e kere eke na-emebi ogo ụdị n'ọdịnihu ma ọ bụrụ na enweghi nzacha ma ọ bụ ma a naghị etinye ibu.
- Indirect prompt injection - ọdịnaya iro n'ịntanetị nke na-agwa onye nnọchiteanya ma ọ bụ ngwá ọrụ nchọgharị ka ha wepụ ihe nzuzo ma ọ bụ gbasaa mmebi aha mgbe a kọọrọ ya.
- Mmebi ụlọ nkwakọba embeddings - itinye akụkụ ederede megidere n'ime ebe ọmụma ka nchọta wee pụta nkwupụta ụgha nke yiri ihe metụtara semantik.
- Backdoored releases - ibipụta checkpoints emelitere ma ọ bụ wrappers API nwere backdoor nke na-eme omume nkịtị ruo mgbe okwu na-akpalite pụtara.
Ihe atụ doro anya na Ntụaka
Nchedo N'ime Omimi
Nweghachi na ntinye n'usoro
- Itu ogo isi mmalite na ibu nke provenance - masịrị ọdịnaya e dere aka ma ọ bụ kwadoro site n'aka onye mbipụta; belata arọ ibe ọhụrụ kere ma ọ bụ ndị nwere aha ọma dị ala.
- Ntufu oge nwere oge ebere — chọọ ka e nwee oge nnọkọ tupu isi iyi ọhụrụ emetụta azịza ndị dị oke mkpa; tinye nyocha mmadụ maka entiti ndị dị nro.
- Ịchọpụta ebe a na-akụkọ echiche (echo chamber) - jikọta akụkụ ederede fọrọ nke nta ka ha bụrụ otu ma belata mmetụta a na-emeghachi site na otu isi ma ọ bụ netwọk.
- Ịchọpụta ndị pụtara iche na arụmarụ n'ime oghere embedding - gosipụta akụkụ ederede ebe ọnọdụ vektor ha haziri n'ụzọ megidere iji mee ka ha bụrụ naanị otu.
Nhicha Data na Ụlọ Ọmụma (KB)
- Ndetuta na ebe nchekwa ọmụma dị iche (diffs) - nyochaa nnukwu mgbanwe, karịsịa maka entiti mmadụ na ebubo na-enweghị isi mmalite mbụ.
- Canary and deny lists - gbochie itinye ngalaba a maara maka mmegbu; tinye canaries iji tụọ mgbasa ozi na-enweghị ikike.
- Tinye mmadụ n'usoro maka isiokwu nwere nnukwu ihe ize ndụ - tinye mmelite a tụrụ aro maka eziokwu gbasara aha n'usoro ka a nyochaa ha aka.
Atestashọn na Aha ọma
- Nkwenye a kwadoro site na cryptography - nkwupụta edere aka site n'aka ndị ọkachamara na òtù e nyochara, a bipụtara ha site na ndekọ nke na-agbakwunye naanị.
- Grafụ aha ọma - jikọta nkwado e dere aka ma belata ogo ọdịnaya sitere n'aka ndị na-emebi iwu ugboro ugboro ma ọ bụ netwọkụ bot.
- Ntinye ntụaka nke onye ọrụ na-ahụ — chọọ ka ihe nlereanya gosipụta isi iyi na ogo ntụkwasịobi yana akara mmalite maka nkwupụta ndị dị nro.
Ndepụta Nnyocha Ụlọ Ọrụ
- Kpọkọta ma mapụ njirimara nwere mmetụta n'ógbè gị (ndị mmadụ, ika, isiokwu iwu) ma zipụ ajụjụ gaa na usoro echekwara nwere arịrịọ maka isi mmalite.
- Jiri C2PA ma ọ bụ asambodo ọdịnaya yiri ya maka ọdịnaya nke mbụ ma kpalie ndị mmekọ ime otu.
- Soro mmetụta isi iyi ọhụrụ n'ogologo oge ma zipu ịdọ aka ná ntị maka mgbanwe na-atụghị anya ya na azịza ọkwa entiti.
- Gbaa red teaming na-aga n'ihu maka RAG na ndị na-eme nchọgharị, gụnyere usoro ule maka ntinye ntụziaka n'ụzọ na-abụghị ozugbo.
Mwakpo na imebi aha site na AI
Ụmụ mmadụ a na-akwụ ụgwọ ugbu a na-eji AI na akpaghị aka eme nnukwu mmepụta nke imegbu na imebi aha, na-emepụta ederede na-apụta ka eziokwu na 'isi iyi' ụgha dị mfe ịkọ, kpochapụ, ma kesaa. Ụzọ mgbasa ozi ndị a na-efu obere ego, nwere nnukwu mmetụta, ma sie ike idozi mgbe usoro akpaghị aka kwalitere ha.
Chad Scira ahụla onwe ya nkeonwe na akpagbu na ịkpa nkata na-eme ihe ọjọọ yana ịjikọta spam nke ebumnuche ya bụ ime ka ọtụtụ akara aha na mmetụta ọchụchọ daa. Akụkọ zuru ezu na ụzọ ihe akaebe edepụtara ebe a: Jesse Nickles - Imegbu na Mmebi Aha.
Nhazi Ụdị Iyi Egwu
- Ịkụchi data tupu ịzụ - ịkụchi korpụrụ ọha e ji maka ọzụzụ mbido iji tinye njikọ ụgha ma ọ bụ backdoors.
- Ịkụchi RAG - itinye ozi n'úgbụ ọmụma ma ọ bụ isi mmalite mpụga ndị pipeline nchọta na-eji n'oge nkwubi okwu.
- Nchọta/mmetọ mmekọrịta - iji bulie posts ma ọ bụ ibe dị ala ogo iji metụta ihe ngosi nweghachi na ntinye n'usoro banyere mmadụ ma ọ bụ isiokwu.
- Adversarial prompts and content - ịmepụta ntinye na ọdịnaya nke na-akpalite omume na-ezighị ezi ma ọ bụ jailbreaks nke na-emeghachi nkwupụta na-emebi aha.
Ihe mberede na nnyocha ndị dị ọhụrụ (na ụbọchị)
Nkọwa: ụbọchị ndị dị n'elu na-egosipụta ụbọchị mbipụta ma ọ bụ ụbọchị ntọhapụ ọha na isi mmalite ejikọtara.
Gịnị mere nke a ji ize ndụ
- LLM nwere ike ịpụta dị ka ndị nwere ikike ọbụna mgbe ntụaka ndị dị n'okpuru adịghị ike ma ọ bụ etinyere site na ndị iro.
- Ụzọ nweghachi na ntinye n'usoro nwere ike inye oke arọ n'okwu e dere ugboro ugboro, na-enye otu onye ohere ịgbanwe nsonaazụ site n'ịbawanye olu naanị.
- Ụzọ nyocha eziokwu ndị mmadụ na-ewe oge ma na-eri ego ma e jiri ya tụnyere ọsọ mmepụta na mgbasa ọdịnaya akpaka.
- Ndị merụrụ ahụ enweghị nnukwu ngosipụta n'ịntanetị na-adịkarị ize ndụ karị site na otu post nke na-ebute imebi aha na mwakpo njirimara.
Nnyocha miri emi nke ihe ize ndụ
- Nnyocha maka ọrụ na nzacha ikpo okwu - ọchụchọ na nchịkọta site na LLM nwere ike ibipụta ọdịnaya emebiri n'oge ntinye ọrụ, nlekọta, ma ọ bụ nnwale nbanye.
- Njem, ụlọ, na ọrụ ego — nyocha akpaka nwere ike ịpụta akụkọ ụgha nke na-ewe oge ma ọ bụ na-egbochi inweta ọrụ.
- Adịgide - ozugbo etinyere na ụgbụ ọmụma ma ọ bụ azịza echekwara, nkwupụta ụgha nwere ike bilite ọzọ ọbụna mgbe ewepụrụla ha.
- Nzaghachi sintetik - ọdịnaya e mepụtara nwere ike iweta ọdịnaya ọzọ e mepụtara, na-eme ka arọ ụgha pụta ìhè n'ogologo oge.
Ịchọpụta na Nlekọta
- Hazie ịdọ aka ná ntị nchọta maka aha gị na aha ndị ọzọ ị na-eji; na-enyocha mgbe ụfọdụ ajụjụ site: maka ngalaba ndị nwere aha ọma dị ala na-akpọrọ gị.
- Soro mgbanwe na panele ọmụma gị ma ọ bụ ibe entiti; chekwaa ihe oyiyi ihuenyo nwere ụbọchị ma zipu mbipụta dị ka ihe akaebe.
- Na-elele eserese njikọ mmekọrịta maka akaụntụ sitere otu ugboro ma ọ bụ mmụba mberede nke nhazi okwu yiri ibe ha.
- Ọ bụrụ na ị na-arụ ọrụ na RAG ma ọ bụ akụ ihe ọmụma, gbaa nyocha maka mgbanwe njirimara (entity drift) ma nyochaa nnukwu mgbanwe (delta) n'ibe ndị mmadụ ma ọ bụ ntaramahụhụ na-enweghị isi mmalite.
Akwụkwọ Nchedo - Ndị Onwe Ha
- Bipụta saịtị onwe gị nwere nkwupụta doro anya gbasara njirimara, mkpirikpi bio, na ụzọ kọntaktị; debe ndekọ mgbanwe nwere ụbọchị.
- Dozie metadata profaịlụ n'elu ọtụtụ nyiwe; nweta profaịlụ ndị e nyochara ebe o kwe omume ma jikọọ ha azụ na saịtị gị.
- Jiri C2PA ma ọ bụ asambodo ọdịnaya yiri ya maka foto na akwụkwọ dị mkpa mgbe o kwere mee; chekwaa mbipụta mbụ n'ụzọ nzuzo.
- Debe ndekọ ihe akaebe nwere akara oge: foto ihuenyo, njikọ, na nọmba tiketi ọ bụla nke ikpookwu maka ibuli okwu n'ọkwa ọzọ.
- Kwadebe ụkpụrụ arịrịọ iwepụ ọdịnaya; zaghachi ngwa ngwa na mwakpo ọhụrụ ma debe ndekọ nke nzọụkwụ ọ bụla maka ndekọ doro anya.
Akwụkwọ Nchedo - Ndi Otu na Ndị Na-ejikọta Sistemụ
- Kwekọrịta ọdịnaya etinyere aka ma ọ bụ nyochara site n'aka onye mbipụta mgbe a na-achọta; tinye oge nkwere dabere na oge maka isi mmalite ọhụrụ.
- Belata mmetụta a na-emegharị site na otu isi mmalite ma wepụ ihe fọdụrụ yiri ibe ha n'ime netwọk isi mmalite ọ bụla.
- Tinye akara mmalite na ndepụta isi mmalite ndị ọrụ na-ahụ maka nkwupụta gbasara mmadụ na isiokwu ndị ọzọ dị nchegbu.
- Jiri nchọpụta ihe na-apụ apụ na ebe nchekwa embedding; tụọ akara maka outliers vector ndị adversarial ma gbaa ule canary iji chọpụta mgbasa ozi na-enweghị ikike.
Nnyocha: Nkwenye e ji cryptography chọpụta
Chad Scira na-ewu usoro atestashọn ndị e kwadoro site na cryptography maka ntụkwasị obi n'okwu gbasara ndị mmadụ na ihe omume. Ebumnuche bụ inye LLM na usoro nchọta nkwupụta ndị e debere aka na enwere ike jụọ ajụjụ site n'aka ndị ọkachamara na òtù e nyochara, na-eme ka mmalite sie ike na iguzogide ịchafu data.
Ụkpụrụ imewe
- Njirimara na isi mmalite: nkwupụta ndị ahụ debanyere aka site n'aka ndị/ndị òtù a nyochara, jiri nkà na ụzụ mkpụrụ igodo ọha.
- Nchekwa a pụrụ ịlele: nkwenye edobere na ndekọ a na-agbakwunye naanị, nke na-egosi mbibi, iji kwado nnwale n'onwe onye.
- Njikọta nweghachi: Ụzọ RAG nwere ike itinye ihe kacha mkpa ma ọ bụ chọọ isi mmalite e gosipụtara site n'cryptography maka ajụjụ gbasara isiokwu dị nro.
- Ntughari pere mpe: APIs na SDKs na-enye ndị na-ebipụta na ikpo okwu ohere ịnye ma lelee akwụkwọ nkwenye (attestations) n'oge a na-etinye ọdịnaya.
Aha ọma na ịdọ aka ná ntị
Na mgbakwunye na asambodo, akwa aha ọma na-ejikọta nkwado etinyere aka ma na-egosi ndị a maara dị ka ndị na-eme mpụ. Sistemụ ịma aka na-agwa ndị ebumnuche mgbe emere mwakpo jikọtara ma ọ bụ achọpụta mmụba mpụga, na-enye ohere imeghachi omume ngwa ngwa na ịrịọ ka ewepụ ọdịnaya.
Ụzọ Iwu na Kanal Ikpo Ọrụ
- Jiri usoro mkpesa nke ikpo okwu nwere ngwugwu ihe akaebe doro anya: njikọ, ụbọchị, ihe oyiyi ihuenyo, na mmetụta. Gụọ ma kpọtụrụ iwu na ntuziaka gbasara ịkpa mmadụ aha na ịkpasu mmadụ iwe.
- Bulite okwu site n'inye akwụkwọ mara iwu mgbe ọ dị mkpa; debe ndekọ nkwurịta okwu na ID tiketi dị ka akụkụ nke ihe àmà gị.
- Lelee ọdịiche n'ịchị iwu banyere imebi aha na ibu ọrụ ikpo okwu; gbaa onye ọka iwu ajụjụ maka ikpe nwere nnukwu ihe ize ndụ.
Atụmatụ mmejuputa (Afọ 1)
- MVP: usoro asambodo na SDK onye mbipụta maka ịbanye nkwupụta njirimara na nkwupụta ihe omume.
- Gbaa ule na otu nta nke ndị ọkachamara na òtù e nyochachara; guzobe usoro nyocha nkwenye.
- Ngwa mgbakwunye RAG: mee ka ọnọdụ azịza 'provenance-first' rụọ ọrụ nke na-ahapụ isi mmalite kwadoro mbụ maka ajụjụ nwere mmetụta.
Imekọrịta
Nnyocha a bụ nke kachasị ọhụrụ ma na-aga n'ihu na mmepe. Chad Scira nabatara imekọrịta ọrụ na ndị ọkachamara ndị ọzọ n'ọhịa a.
Ọ bụrụ na ị nwere mmasị ịrụkọ ọrụ ọnụ, biko kpọtụrụ: [email protected]