Paano Natututo ang AI?

Paano Natututo ang AI?,tinatalakay ng gabay na ito ang mahahalagang ideya sa simpleng wika—kasama ang mga halimbawa, maliliit na paglihis, at ilang di-perpektong metapora na medyo nakakatulong pa rin. Simulan na natin. 🙂

Mga artikulong maaaring gusto mong basahin pagkatapos nito:

🔗 Ano ang predictive AI
Paano hinuhulaan ng mga predictive model ang mga resulta gamit ang historical at real-time na data.

🔗 Anong mga industriya ang makakaapekto sa AI
Mga sektor na malamang na nabago ng automation, analytics, at mga ahente.

🔗 Ano ang ibig sabihin ng GPT
Isang malinaw na paliwanag ng acronym at mga pinagmulan ng GPT.

🔗 Ano ang mga kasanayan sa AI
Mga pangunahing kakayahan para sa pagbuo, pag-deploy, at pamamahala ng mga sistema ng AI.

Kaya, paano ito ginagawa? ✅

Kapag tinatanong ng mga tao kung Paano Natututo ang AI?,kadalasan ang ibig nilang sabihin ay: paano nagiging kapaki-pakinabang ang mga modelo sa halip na mga magarbong laruan lamang sa matematika. Ang sagot ay isang recipe:

Malinaw na layunin - isang tungkulin ng pagkalugi na tumutukoy sa kung ano ang ibig sabihin ng "mabuti". [1]
De-kalidad na datos - iba-iba, malinis, at may kaugnayan. Nakakatulong ang dami; mas nakakatulong ang pagkakaiba-iba. [1]
Matatag na pag-optimize - gradient descent na may mga trick upang maiwasan ang pag-ugoy mula sa bangin. [1], [2]
Paglalahat - tagumpay sa bagong datos, hindi lamang sa hanay ng pagsasanay. [1]
Mga loop ng feedback - pagsusuri, pagsusuri ng error, at pag-ulit. [2], [3]
Kaligtasan at pagiging maaasahan - mga barandilya, pagsubok, at dokumentasyon para hindi ito magdulot ng kaguluhan. [4]

Para sa mga madaling maunawaang pundasyon, ang klasikong teksto ng deep learning, mga tala sa kurso na madaling makita, at isang praktikal na crash course ay sumasaklaw sa mga mahahalagang impormasyon nang hindi ka nalulunod sa mga simbolo. [1]–[3]

Paano natututo ang AI? Ang maikling sagot sa simpleng Ingles ✍️

Ang isang modelo ng AI ay nagsisimula sa mga random na halaga ng parameter. Gumagawa ito ng hula. Bibigyan mo ng marka ang hulang iyon ng loss. Pagkatapos ay i-nudge mo ang mga parameter na iyon upang mabawasan ang loss gamit ang mga gradient. Ulitin ang loop na ito sa maraming halimbawa hanggang sa tumigil ang modelo sa pagbuti (o maubusan ka ng meryenda). Iyan ang training loop sa isang paghinga. [1], [2]

Kung gusto mo ng mas tumpak na impormasyon, tingnan ang mga seksyon tungkol sa gradient descent at backpropagation sa ibaba. Para sa mabilis at madaling maunawaang impormasyon, maraming maiikling lektura at laboratoryo ang makukuha. [2], [3]

Ang mga pangunahing kaalaman: datos, mga layunin, pag-optimize 🧩

Datos: Mga input (x) at mga target (y). Kung mas malawak at mas malinis ang datos, mas malaki ang iyong pagkakataong gawing pangkalahatan. Ang pagpili ng datos ay hindi kaakit-akit, ngunit ito ang hindi kilalang bayani. [1]
Modelo: Isang punsiyon (f_\theta(x)) na may mga parametro (\theta). Ang mga neural network ay mga salansan ng mga simpleng yunit na nagsasama-sama sa mga kumplikadong paraan—mga Lego brick, ngunit mas malambot. [1]
Layunin: Isang pagkawala (L(f_\theta(x), y)) na sumusukat sa error. Mga halimbawa: mean squared error (regression) at cross-entropy (klasipikasyon). [1]
Optimization: Gamitin ang (stochastic) gradient descent upang i-update ang mga parameter: (\theta \leftarrow \theta - \eta \nabla_\theta L). Ang learning rate (\eta): masyadong malaki at ikaw ay tumatalbog; masyadong maliit at ikaw ay natutulog nang matagal. [2]

Para sa malinis na pagpapakilala sa mga loss function at optimization, ang mga klasikong tala sa mga trick at pitfall sa pagsasanay ay isang mahusay na pagsilip. [2]

Pinangangasiwaang pagkatuto: matuto mula sa mga halimbawang may label 🎯

Ideya: Ipakita ang mga pares ng input at tamang sagot ng modelo. Natututo ang modelo ng isang mapping (x \rightarrow y).

Mga karaniwang gawain: klasipikasyon ng imahe, pagsusuri ng damdamin, prediksyon sa tabular, pagkilala sa pagsasalita.
Karaniwang mga pagkalugi: cross-entropy para sa klasipikasyon, mean squared error para sa regresyon. [1]
Mga patibong: ingay ng label, kawalan ng balanse ng klase, pagtagas ng datos.
Mga Pag-aayos: stratified sampling, matatag na pagkalugi, regularisasyon, at mas magkakaibang pangongolekta ng datos. [1], [2]

Batay sa mga dekada ng mga benchmark at kasanayan sa produksyon, ang supervised learning ay nananatiling pinakamabisang paraan dahil ang mga resulta ay nahuhulaan at ang mga sukatan ay diretso. [1], [3]

Pagkatutong walang pangangasiwa at sariling pangangasiwa: alamin ang istruktura ng datos 🔍

ang walang superbisyon nang walang mga etiketa.

Pagkumpol: pagpangkat-pangkatin ang mga magkakatulad na punto—ang k-means ay simple at nakakagulat na kapaki-pakinabang.
Pagbawas ng dimensyon: i-compress ang data sa mahahalagang direksyon—ang PCA ang gateway tool.
Pagmomodelo ng Densidad/Henerative: alamin ang mismong distribusyon ng datos. [1]

may sariling superbisyon : ang mga modelo ay lumilikha ng sarili nilang superbisyon (masked prediction, contrastive learning), na nagbibigay-daan sa iyong magsanay muna sa mga karagatan ng walang label na datos at pinuhin ito kalaunan. [1]

Pagkatuto gamit ang reinforcement: matuto sa pamamagitan ng paggawa at pagtanggap ng feedback 🕹️

Ang isang ahente ay nakikipag-ugnayan sa isang kapaligiran, tumatanggap ng mga gantimpala, at natututo ng isang patakaran na nagpapalaki sa pangmatagalang gantimpala.

Mga Pangunahing Piraso: estado, aksyon, gantimpala, patakaran, tungkulin ng halaga.
Mga Algoritmo: Q-learning, mga gradient ng patakaran, aktor-kritiko.
Paggalugad vs. pagsasamantala: sumubok ng mga bagong bagay o muling gamitin ang epektibo.
Pagtatalaga ng kredito: aling aksyon ang nagdulot ng aling resulta?

Ang feedback ng tao ay maaaring gumabay sa pagsasanay kapag ang mga gantimpala ay magulo—ang pagraranggo o mga kagustuhan ay nakakatulong sa paghubog ng pag-uugali nang hindi kinakailangang i-handcode ang perpektong gantimpala. [5]

Deep learning, backprop, at gradient descent - ang tumitibok na puso 🫀

Ang mga neural net ay mga komposisyon ng mga simpleng tungkulin. Upang matuto, umaasa ang mga ito sa backpropagation:

Pasulong na pasa: kalkulahin ang mga hula mula sa mga input.
Pagkawala: pagsukat ng error sa pagitan ng mga hula at mga target.
Backward pass: ilapat ang chain rule upang kalkulahin ang mga gradient ng loss sa bawat parameter.
Update: i-nudge ang mga parameter laban sa gradient gamit ang isang optimizer.

Ang mga variant tulad ng momentum, RMSProp, at Adam ay ginagawang hindi gaanong temperamental ang pagsasanay. Ang mga pamamaraan ng regularization tulad ng dropout, weight decay, at early stopping ay tumutulong sa mga modelo na gawing pangkalahatan sa halip na isaulo. [1], [2]

Mga Transformer at Atensyon: Bakit Mukhang Matalino ang mga Modernong Modelo 🧠✨

Pinalitan ng mga transformer ang maraming paulit-ulit na setup sa wika at paningin. Ang pangunahing trick ay ang self-attention, na nagbibigay-daan sa isang modelo na timbangin ang iba't ibang bahagi ng input nito depende sa konteksto. Ang positional encodings ay humahawak sa pagkakasunud-sunod, at ang multi-head attention ay nagbibigay-daan sa modelo na tumuon sa iba't ibang relasyon nang sabay-sabay. Ang scaling—mas magkakaibang data, mas maraming parameter, mas mahabang pagsasanay—ay kadalasang nakakatulong, na may lumiliit na kita at tumataas na gastos. [1], [2]

Paglalahat, overfitting, at ang sayaw ng bias-variance 🩰

Kayang mag-ace ng isang modelo sa training set at mag-flop pa rin sa totoong buhay.

Overfitting: kabisaduhin ang ingay. Bumaba ang error sa pagsasanay, pataas ang error sa pagsubok.
Kulang sa pagkakabit: masyadong simple; nawawalan ng signal.
Kalakalan sa bias–baryan: binabawasan ng pagiging kumplikado ang bias ngunit maaaring mapataas ang barian.

Paano mas mahusay na gawing pangkalahatan:

Mas magkakaibang datos - iba't ibang pinagmulan, sakop, at mga edge case.
Regularisasyon - pagtigil sa pag-aaral, pagbaba ng timbang, pagpapalaki ng datos.
Wastong pagpapatunay - malinis na mga set ng pagsubok, cross-validation para sa maliliit na datos.
Pagsubaybay sa pag-iiba - ang distribusyon ng iyong data ay magbabago sa paglipas ng panahon.

Ang mga kasanayang may kamalayan sa panganib ay nakabalangkas sa mga ito bilang mga aktibidad sa lifecycle—pamamahala, pagmamapa, pagsukat, at pamamahala—hindi mga minsanang checklist. [4]

Mga mahalagang sukatan: kung paano natin nalalaman na nangyari ang pagkatuto 📈

Klasipikasyon: katumpakan, katumpakan, paggunita, F1, ROC AUC. Ang hindi balanseng datos ay nangangailangan ng mga kurba ng katumpakan-paggunita. [3]
Regresyon: MSE, MAE, (R^2). [1]
Pagraranggo/pagkuha: MAP, NDCG, recall@K. [1]
Mga modelong generative: kalituhan (wika), BLEU/ROUGE/CIDEr (teksto), mga iskor na nakabatay sa CLIP (multimodal), at mga ebalwasyon na mahalaga sa tao. [1], [3]

Pumili ng mga sukatan na naaayon sa epekto ng gumagamit. Ang isang maliit na pagtaas sa katumpakan ay maaaring walang kaugnayan kung ang mga maling positibo ang tunay na gastos. [3]

Daloy ng trabaho sa pagsasanay sa totoong mundo: isang simpleng blueprint 🛠️

Balangkasin ang problema - tukuyin ang mga input, output, limitasyon, at pamantayan sa tagumpay.
Pipeline ng datos - pangongolekta, paglalagay ng label, paglilinis, paghahati, pagpapalaki.
Baseline - magsimula nang simple; ang mga linear o tree baseline ay nakakagulat na mapagkumpitensya.
Pagmomodelo - subukan ang ilang pamilya: mga puno na pinalakas ng gradient (tabular), mga CNN (mga imahe), mga transformer (teksto).
Pagsasanay - iskedyul, mga estratehiya sa bilis ng pagkatuto, mga checkpoint, magkahalong katumpakan kung kinakailangan.
Ebalwasyon - mga ablation at pagsusuri ng pagkakamali. Tingnan ang mga pagkakamali, hindi lamang ang karaniwan.
Pag-deploy - pipeline ng paghihinuha, pagsubaybay, pag-log, plano ng rollback.
I-iterate - mas mahusay na data, pagpino, o mga pagsasaayos sa arkitektura.

Mini case: isang proyektong pangklasipikasyon sa email ang nagsimula sa isang simpleng linear baseline, pagkatapos ay pinino ang isang paunang sinanay na transformer. Ang pinakamalaking panalo ay hindi ang modelo—ito ay ang paghigpit ng rubric sa pag-label at pagdaragdag ng mga kategoryang "edge" na kulang sa representasyon. Nang masakop ang mga iyon, sa wakas ay nasubaybayan ng validation F1 ang totoong performance sa mundo. (Ang iyong sarili sa hinaharap: lubos na nagpapasalamat.)

Kalidad ng datos, paglalagay ng label, at ang banayad na sining ng hindi pagsisinungaling sa iyong sarili 🧼

Basura, pagsisisihan. Ang mga alituntunin sa paglalagay ng label ay dapat na pare-pareho, masusukat, at masuri. Mahalaga ang kasunduan sa pagitan ng mga tagapagtala.

Sumulat ng mga rubric na may mga halimbawa, mga corner case, at mga tie-breaker.
I-audit ang mga dataset para sa mga duplicate at halos duplicate.
Subaybayan ang pinagmulan—kung saan nagmula ang bawat halimbawa at kung bakit ito kasama.
Sukatin ang saklaw ng datos laban sa mga totoong sitwasyon ng gumagamit, hindi lamang isang maayos na benchmark.

Ang mga ito ay akmang-akma sa mas malawak na balangkas ng katiyakan at pamamahala na maaari mong aktwal na maipatupad. [4]

Paglilipat ng pagkatuto, pagpino, at mga adaptor - gamitin muli ang mabibigat na gawain ♻️

Natututo ang mga paunang sinanay na modelo ng mga pangkalahatang representasyon; inaangkop naman ito ng pagpipino sa iyong gawain na may mas kaunting datos.

Pagkuha ng katangian: i-freeze ang gulugod, sanayin ang isang maliit na ulo.
Ganap na pagpipino: i-update ang lahat ng parameter para sa pinakamataas na kapasidad.
Mga pamamaraang mahusay sa parameter: mga adapter, mga low-rank na update na istilong LoRA - mainam kapag masikip ang compute.
Pag-aangkop ng domain: pag-align ng mga embedding sa iba't ibang domain; maliliit na pagbabago, malalaking pakinabang. [1], [2]

Ang ganitong paraan ng muling paggamit ang dahilan kung bakit mabilis na nakakagalaw ang mga modernong proyekto nang walang malalaking badyet.

Kaligtasan, pagiging maaasahan, at pagkakahanay - ang mga hindi opsyonal na piraso 🧯

Ang pagkatuto ay hindi lamang tungkol sa katumpakan. Gusto mo rin ng mga modelong matatag, patas, at naaayon sa nilalayong paggamit.

Katatagan ng tunggalian: ang maliliit na kaguluhan ay maaaring makalinlang sa mga modelo.
Pagkiling at pagiging patas: sukatin ang pagganap ng subgroup, hindi lamang ang pangkalahatang mga average.
Kakayahang Magbigay-kahulugan: ang pagpapatungkol at pagsusuri ng tampok ay makakatulong sa iyo na makita kung bakit.
Tao sa loop: mga landas ng escalation para sa mga desisyong hindi malinaw o may malaking epekto. [4], [5]

Ang pagkatuto batay sa kagustuhan ay isang praktikal na paraan upang maisama ang paghatol ng tao kapag ang mga layunin ay malabo. [5]

Mga Madalas Itanong sa loob ng isang minuto - mabilis na pagpapaputok ⚡

Kaya, talaga, Paano Natututo ang AI? Sa pamamagitan ng paulit-ulit na pag-optimize laban sa isang pagkalugi, na may mga gradient na gumagabay sa mga parameter patungo sa mas mahusay na mga hula. [1], [2]
Nakakatulong ba palagi ang mas maraming datos? Kadalasan, hanggang sa lumiliit ang kita. Kadalasang mas malaki ang natatamo kaysa sa dami ng datos. [1]
Paano kung magulo ang mga label? Gumamit ng mga pamamaraang hindi nakakaabala sa ingay, mas mahusay na mga rubric, at isaalang-alang ang self-supervised pretraining. [1]
Bakit nangingibabaw ang mga transformer? Mahusay ang pag-scale ng atensyon at nakukuha ang mga long-range dependencies; mature na ang tooling. [1], [2]
Paano ko malalaman kung tapos na ako sa pagsasanay? Ang mga plateau ng pagkawala ng pagpapatunay, ang mga sukatan ay nagiging matatag, at ang mga bagong datos ay kumikilos ayon sa inaasahan—pagkatapos ay subaybayan ang paglihis. [3], [4]

Talahanayan ng Paghahambing - mga kagamitang maaari mo talagang gamitin ngayon 🧰

Medyo kakaiba kung tutuusin. Ang mga presyo ay para sa mga pangunahing aklatan—ang malawakang pagsasanay ay may mga gastos sa imprastraktura, siyempre.

Kagamitan	Pinakamahusay para sa	Presyo	Bakit ito gumagana nang maayos
PyTorch	Mga mananaliksik, tagapagtayo	Libre - bukas na src	Mga dinamikong graph, malakas na ecosystem, magagandang tutorial.
TensorFlow	Mga pangkat ng produksyon	Libre - bukas na src	Para sa mga nasa hustong gulang, TF Lite para sa mobile; malaking komunidad.
scikit-learn	Datos na tabular, mga baseline	Libre	Malinis na API, mabilis ulitin, mahusay na mga dokumento.
Keras	Mabilisang mga prototype	Libre	Mataas na antas ng API sa TF, mga nababasang layer.
JAX	Mga power user, pananaliksik	Libre	Awtomatikong pag-vector, bilis ng XLA, eleganteng math vibes.
Mga Transformer na Nagyayakapan	NLP, paningin, audio	Libre	Mga paunang sinanay na modelo, simpleng pag-aayos, magagandang hub.
Kidlat	Mga daloy ng trabaho sa pagsasanay	Libreng core	Kasama ang istruktura, pag-log, at mga bateryang may maraming GPU.
XGBoost	Kompetitibong tabular	Libre	Matibay na mga baseline, kadalasang nananalo sa nakabalangkas na datos.
Mga Timbang at Pagkiling	Pagsubaybay sa eksperimento	Libreng antas	Kakayahang kopyahin, ihambing ang mga pagtakbo, mas mabilis na mga loop ng pagkatuto.

Mga makapangyarihang dokumento para makapagsimula: PyTorch, TensorFlow, at ang maayos na gabay sa paggamit ng scikit-learn. (Pumili ng isa, bumuo ng isang maliit na bagay, ulitin.)

Malalimang pagsisiyasat: mga praktikal na tip na makakatipid sa iyo ng totoong oras 🧭

Mga iskedyul ng bilis ng pagkatuto: ang cosine decay o one-cycle ay maaaring magpatatag ng pagsasanay.
Laki ng batch: ang mas malaki ay hindi palaging mas mahusay na sukatan ng pagpapatunay, hindi lamang ang throughput.
Weight init: ayos lang ang mga modernong default; kung matigil ang pagsasanay, muling bisitahin ang initialization o gawing normal ang mga unang layer.
Normalisasyon: ang batch norm o layer norm ay maaaring lubos na makapagpapadali ng pag-optimize.
Pagpapalaki ng datos: mga flip/crop/color jitter para sa mga imahe; masking/token shuffling para sa teksto.
Pagsusuri ng error: ang pagpapangkat ng mga error ayon sa slice-one edge case ay maaaring makabawas ng lahat.
Repro: magtakda ng mga buto, mag-log ng mga hyperparam, mag-save ng mga checkpoint. Sa hinaharap, pangako ko, magpapasalamat ka. [2], [3]

Kung may pag-aalinlangan, balikan ang mga pangunahing kaalaman. Ang mga pangunahing kaalaman ang nananatiling gabay. [1], [2]

Isang maliit na metapora na halos gumana 🪴

Ang pagsasanay sa isang modelo ay parang pagdidilig ng halaman gamit ang kakaibang nozzle. Masyadong maraming tubig na nakakapag-absorb ng puddle. Masyadong kaunti na hindi nakakapag-absorb ng tagtuyot. Ang tamang cadence, na may sikat ng araw mula sa magagandang datos at mga sustansya mula sa malilinis na objective, at lumalago ka. Oo, medyo cheesy, pero nananatili ito.

Paano Natututo ang AI? Pinagsasama-sama ang lahat 🧾

Nagsisimula nang random ang isang modelo. Sa pamamagitan ng mga pag-update batay sa gradient, na ginagabayan ng isang pagkawala, inaayon nito ang mga parameter nito sa mga pattern sa data. Lumilitaw ang mga representasyon na nagpapadali sa prediksyon. Sinasabi sa iyo ng ebalwasyon kung ang pagkatuto ay totoo, hindi aksidente. At ang iterasyon—na may mga guardrail para sa kaligtasan—ay ginagawang isang maaasahang sistema ang isang demo. Iyan ang buong kwento, na may mas kaunting mahiwagang vibes kaysa sa unang tingin. [1]–[4]

Mga Pangwakas na Paalala - Masyadong Mahaba, Hindi Nabasa 🎁

Paano natututo ang AI? Sa pamamagitan ng pagliit ng isang pagkalugi gamit ang mga gradient sa maraming halimbawa. [1], [2]
Ang mahusay na datos, malinaw na mga layunin, at matatag na pag-optimize ang nagpapatibay sa pagkatuto. [1]–[3]
Mas mainam ang paglalahat kaysa sa pagsasaulo—lagi. [1]
Ang kaligtasan, pagsusuri, at pag-ulit ay ginagawang maaasahang mga produkto ang matatalinong ideya. [3], [4]
Magsimula nang simple, sukatin nang mabuti, at pagbutihin sa pamamagitan ng pag-aayos ng datos bago mo habulin ang mga kakaibang arkitektura. [2], [3]

Mga Sanggunian

Goodfellow, Bengio, Courville - Deep Learning (libreng online na teksto). Link
Stanford CS231n - Mga Convolutional Neural Network para sa Visual Recognition (mga tala ng kurso at mga takdang-aralin). Link
Google - Kurso sa Pag-aaral ng Makina: Mga Sukatan ng Klasipikasyon (Katumpakan, Katumpakan, Paggunita, ROC/AUC). Link
NIST - Balangkas ng Pamamahala ng Panganib ng AI (AI RMF 1.0). Link
OpenAI - Pagkatuto mula sa mga Kagustuhan ng Tao (pangkalahatang-ideya ng pagsasanay batay sa kagustuhan). Link

Hanapin ang Pinakabagong AI sa Opisyal na Tindahan ng AI Assistant

Tungkol sa Amin

Balik sa blog