Ano ang Neural Network sa AI?

Parang misteryoso ang mga neural network hangga't hindi pa ito nangyayari. Kung naisip mo na kung ano ang Neural Network sa AI? at kung matematika lang ba ito na may magarbong disenyo, nasa tamang lugar ka. Gagawin natin itong praktikal, magdagdag ng maliliit na detalye, at oo - ilang emoji. Aalis kang alam mo kung ano ang mga sistemang ito, bakit sila gumagana, kung saan sila nabibigo, at kung paano pag-uusapan ang mga ito nang hindi kinukuwestiyon ang mga ito.

Mga artikulong maaaring gusto mong basahin pagkatapos nito:

🔗 Ano ang AI bias
Pag-unawa sa bias sa mga sistema at estratehiya ng AI para matiyak ang pagiging patas.

🔗 Ano ang predictive AI
Paano ginagamit ng predictive AI ang mga pattern para hulaan ang mga kinalabasan sa hinaharap.

🔗 Ano ang isang tagapagsanay ng AI
Paggalugad sa tungkulin at responsibilidad ng mga propesyonal na nagsasanay sa AI.

🔗 Ano ang computer vision sa AI
Paano binibigyang-kahulugan at sinusuri ng AI ang visual na data sa pamamagitan ng computer vision.

Ano ang isang Neural Network sa AI? Ang 10 segundong sagot ⏱️

Ang neural network ay isang salansan ng mga simpleng yunit ng kalkulasyon na tinatawag na mga neuron na nagpapasa ng mga numero, inaayos ang kanilang mga lakas ng koneksyon habang nagsasanay, at unti-unting natututo ng mga pattern sa data. Kapag narinig mo ang deep learning, kadalasan ay nangangahulugan ito ng isang neural network na may maraming nakasalansan na layer, awtomatikong nagtatampok ang pag-aaral sa halip na manu-mano mong i-code ang mga ito. Sa madaling salita: maraming maliliit na piraso ng matematika, na mahusay na inayos, sinanay sa data hanggang sa maging kapaki-pakinabang ang mga ito [1].

Ano ang ginagawang kapaki-pakinabang ng Neural Network? ✅

Kapangyarihan ng representasyon: Gamit ang tamang arkitektura at laki, maaaring tantiyahin ng mga network ang mga napakasalimuot na function (tingnan ang Universal Approximation Theorem) [4].
End-to-end learning: Sa halip na mga feature ng hand-engineering, natuklasan ng modelo ang mga ito [1].
Paglalahat: Ang isang maayos na naayos na network ay hindi lamang nagsasaulo - gumagana ito sa bago at hindi nakikitang datos [1].
Kakayahang Iskalahin: Ang mas malalaking dataset at mas malalaking modelo ay kadalasang patuloy na nagpapabuti ng mga resulta… hanggang sa mga praktikal na limitasyon tulad ng kalidad ng compute at data [1].
Transferability: Ang mga feature na natutunan sa isang gawain ay makakatulong sa isa pa (transfer learning at fine-tuning) [1].

Maliit na tala (halimbawang senaryo): Isang maliit na pangkat ng klasipikasyon ng produkto ang nagpapalit ng mga gawang-kamay na tampok para sa isang compact na CNN, nagdaragdag ng mga simpleng pagpapahusay (mga flip/crop), at pinapanood ang pagbaba ng error sa pagpapatunay - hindi dahil ang network ay "mahika," kundi dahil natuto ito ng mas maraming kapaki-pakinabang na tampok nang direkta mula sa mga pixel.

"Ano ang isang Neural Network sa AI?" sa payak na Ingles, na may malutong na metapora 🍞

Larawan ng linya ng panaderya. Pumasok ang mga sangkap, sinasabunutan ng mga manggagawa ang recipe, nagrereklamo ang mga tagasubok ng lasa, at ina-update muli ng team ang recipe. Sa isang network, ang mga input ay dumadaloy sa mga layer, ang loss function ay nagmarka sa output, at ang mga gradient ay nag-uudyok ng mga timbang upang maging mas mahusay sa susunod na pagkakataon. Hindi perpekto bilang isang metapora - ang tinapay ay hindi naiba-iba - ngunit ito ay nananatili [1].

Ang anatomy ng isang neural network 🧩

Mga Neurons: Mga maliliit na calculator na nag-aaplay ng weighted sum at isang activation function.
Mga Timbang at Pagkiling: Mga naaayos na hawakan na tumutukoy kung paano nagsasama-sama ang mga signal.
Mga Layer: Ang input layer ay tumatanggap ng data, ang mga nakatagong layer ay nagbabago nito, ang output layer ay gumagawa ng hula.
Mga function ng pag-activate: Ang mga nonlinear na twist tulad ng ReLU, sigmoid, tanh, at softmax ay ginagawang flexible ang pag-aaral.
Loss function: Isang marka kung gaano mali ang hula (cross-entropy para sa pag-uuri, MSE para sa regression).
Optimizer: Gumagamit ang mga algorithm tulad ng SGD o Adam ng mga gradient para i-update ang mga timbang.
Regularization: Mga diskarte tulad ng pag-dropout o pagbaba ng timbang upang maiwasang mag-overfitting ang modelo.

Kung gusto mo ang pormal na paggamot (ngunit nababasa pa rin), ang bukas na aklat-aralin na Deep Learning ay sumasaklaw sa buong stack: mga pundasyon ng matematika, pag-optimize, at paglalahat [1].

Mga function ng pag-activate, sa madaling sabi ngunit nakakatulong ⚡

ReLU: Zero para sa mga negatibo, linear para sa mga positibo. Simple, mabilis, epektibo.
Sigmoid: Mga squashes na halaga sa pagitan ng 0 at 1 - kapaki-pakinabang ngunit maaaring mababad.
Tanh: Parang sigmoid ngunit simetriko sa paligid ng zero.
Softmax: Ginagawang probabilidad ang mga hilaw na marka sa mga klase.

Hindi mo kailangang kabisaduhin ang bawat hugis ng kurba - alamin lang ang mga trade-off at karaniwang mga default [1, 2].

Paano aktwal na nangyayari ang pag-aaral: backprop, ngunit hindi nakakatakot 🔁

Pasulong na pass: Ang data ay dumadaloy sa bawat layer upang makabuo ng isang hula.
Compute loss: Ihambing ang hula sa katotohanan.
Backpropagation: Compute gradients ng pagkawala kaugnay ng bawat timbang gamit ang chain rule.
Update: Binabago ng Optimizer ang mga timbang nang kaunti.
Ulitin: Maraming panahon. Unti-unting natututo ang modelo.

Para sa isang hands-on na intuwisyon na may mga visual at code-adjacent na mga paliwanag, tingnan ang klasikong CS231n na mga tala sa backprop at optimization [2].

Ang mga pangunahing pamilya ng mga neural network, sa isang sulyap 🏡

Feedforward network (MLPs): Ang pinakasimpleng uri. Sumusulong lang ang data.
Convolutional Neural Networks (CNNs): Mahusay para sa mga larawan salamat sa mga spatial na filter na nakakakita ng mga gilid, texture, hugis [2].
Mga Paulit-ulit na Neural Network (RNN) at mga variant: Ginawa para sa mga sequence tulad ng teksto o time series sa pamamagitan ng pagpapanatili ng kaayusan [1].
Mga Transformer: Gumamit ng pansin sa modelo ng mga relasyon sa mga posisyon sa isang pagkakasunud-sunod nang sabay-sabay; nangingibabaw sa wika at higit pa [3].
Graph Neural Networks (GNNs): Gumagana sa mga node at gilid ng isang graph - kapaki-pakinabang para sa mga molekula, social network, rekomendasyon [1].
Mga Autoencoder at VAE: Matuto ng mga naka-compress na representasyon at bumuo ng mga baryasyon [1].
Mga generative na modelo: Mula sa mga GAN hanggang sa mga modelo ng pagsasabog, na ginagamit para sa mga larawan, audio, kahit na code [1].

Ang mga tala ng CS231n ay lalong palakaibigan para sa mga CNN, habang ang papel ng Transformer ay ang pangunahing pinagmumulan para sa mga modelong nakabatay sa atensyon [2, 3].

Talahanayan ng paghahambing: karaniwang mga uri ng neural network, para kanino sila, cost vibes, at bakit gumagana ang mga ito 📊

Tool / Uri	Madla	Presyo lang	Bakit ito gumagana
Feedforward (MLP)	Mga nagsisimula, analyst	Low-medium	Simple, flexible, disenteng baseline
CNN	Mga pangkat ng paningin	Katamtaman	Mga lokal na pattern + pagbabahagi ng parameter
RNN / LSTM / GRU	Sequence mga kabayan	Katamtaman	Temporal memory-ish… kumukuha ng order
Transpormador	NLP, multimodal	Katamtaman-taas	Nakatuon ang atensyon sa mga nauugnay na relasyon
GNN	Mga siyentipiko, recsys	Katamtaman	Ang pagpasa ng mensahe sa mga graph ay nagpapakita ng istraktura
Autoencoder / VAE	Mga mananaliksik	Low-medium	Natututo ng mga naka-compress na representasyon
GAN / Pagsasabog	Mga malikhaing lab	Katamtaman-taas	Adversarial o iterative denoising magic

Mga Tala: ang pagpepresyo ay tungkol sa pagkalkula at oras; iba-iba ang mileage mo. Ang isang cell o dalawa ay sadyang madaldal.

"Ano ang isang Neural Network sa AI?" kumpara sa mga klasikong ML algorithm ⚖️

Feature engineering: Madalas na umaasa ang Classic ML sa mga manual na feature. Ang mga neural net ay awtomatikong natututo ng mga tampok - isang malaking panalo para sa kumplikadong data [1].
Data hunger: Madalas na kumikinang ang mga network na may mas maraming data; ang maliit na data ay maaaring pabor sa mas simpleng mga modelo [1].
Pagtutuos: Gustung-gusto ng mga network ang mga accelerator tulad ng mga GPU [1].
Performance ceiling: Para sa hindi nakabalangkas na data (mga larawan, audio, text), ang mga malalalim na lambat ay kadalasang nangingibabaw [1, 2].

Ang workflow ng pagsasanay na talagang gumagana sa pagsasanay 🛠️

Tukuyin ang layunin: Pag-uuri, pagbabalik, pagraranggo, henerasyon - pumili ng isang pagkatalo na tumutugma.
Data wrangling: Hatiin sa tren/validation/test. I-normalize ang mga feature. Balanse ang mga klase. Para sa mga larawan, isaalang-alang ang pagpapalaki tulad ng mga flips, crops, maliit na ingay.
Pagpili ng arkitektura: Magsimula nang simple. Magdagdag lamang ng kapasidad kung kinakailangan.
Training loop: I-batch ang data. Pasulong na pass. Kalkulahin ang pagkawala. Backprop. Update. Log metrics.
I-regularize: Dropout, pagbaba ng timbang, maagang paghinto.
Suriin: Gamitin ang validation set para sa mga hyperparameter. Maghintay ng set ng pagsubok para sa panghuling tseke.
Ipadala nang mabuti: Subaybayan ang drift, tingnan kung may bias, planuhin ang mga rollback.

Para sa end-to-end, code-oriented na mga tutorial na may matatag na teorya, ang bukas na aklat-aralin at CS231n na mga tala ay maaasahang mga anchor [1, 2].

Overfitting, generalization, at iba pang gremlins 👀

Overfitting: Kabisado ng modelo ang mga quirks sa pagsasanay. Ayusin gamit ang mas maraming data, mas malakas na regularization, o mas simpleng mga arkitektura.
Underfitting: Masyadong simple ang modelo o masyadong mahiyain ang pagsasanay. Dagdagan ang kapasidad o magsanay nang mas matagal.
Data leakage: Ang impormasyon mula sa test set ay pumapasok sa pagsasanay. Triple-check ang iyong mga split.
Mahinang kalibrasyon: Mapanganib ang isang modelong may kumpiyansa ngunit mali. Isaalang-alang ang kalibrasyon o iba't ibang loss weighting.
Paglipat ng pamamahagi: Mga paglipat ng data sa totoong mundo. Subaybayan at iakma.

Para sa teorya sa likod ng generalization at regularization, manalig sa mga karaniwang sanggunian [1, 2].

Kaligtasan, interpretability, at responsableng deployment 🧭

Ang mga neural network ay maaaring gumawa ng mga desisyong may malaking pusta. Hindi sapat na mahusay ang kanilang pagganap sa isang leaderboard. Kailangan mo ng mga hakbang sa pamamahala, pagsukat, at pagpapagaan sa buong lifecycle. Binabalangkas ng NIST AI Risk Management Framework ang mga praktikal na tungkulin - GOVERN, MAPA, SUKAT, MANAGE - upang matulungan ang mga team na maisama ang pamamahala ng panganib sa disenyo at pag-deploy [5].

Ilang mabilis na siko:

Mga pagsusuri sa bias: Suriin ang lahat ng demograpikong hiwa kung saan naaangkop at ayon sa batas.
Kakayahang Magbigay-kahulugan: Gumamit ng mga pamamaraan tulad ng kapansin-pansin o mga katangiang tampok. Hindi man perpekto ang mga ito, ngunit kapaki-pakinabang.
Pagsubaybay: Magtakda ng mga alerto para sa biglaang pagbaba ng sukatan o pag-drift ng data.
Pangangasiwa ng tao: Panatilihin ang mga tao sa loop para sa mga desisyon na mabigat sa epekto. Walang heroics, hygiene lang.

Mga madalas itanong na lihim mo 🙋

Ang isang neural network ba ay karaniwang isang utak?

May inspirasyon ng mga utak, oo - ngunit pinasimple. Ang mga neuron sa mga network ay mga function ng matematika; Ang mga biological neuron ay mga buhay na selula na may kumplikadong dinamika. Katulad na vibes, ibang-iba ang physics [1].

Ilang layer ang kailangan ko?

Magsimula sa maliit. Kung kulang ka, magdagdag ng lapad o lalim. Kung overfitting ka, gawing regular o bawasan ang kapasidad. Walang magic number; mayroon lang validation curves at pasensya [1].

Kailangan ko ba lagi ng GPU?

Hindi palagi. Ang mga maliliit na modelo sa katamtamang data ay maaaring magsanay sa mga CPU, ngunit para sa mga larawan, malalaking modelo ng teksto, o malalaking dataset, ang mga accelerator ay nakakatipid ng toneladang oras [1].

Bakit sinasabi ng mga tao na makapangyarihan ang atensyon?

Dahil binibigyang-daan ng pansin ang mga modelo na tumuon sa mga pinaka-kaugnay na bahagi ng isang input nang hindi mahigpit na nagmamartsa sa pagkakasunud-sunod. Kinukuha nito ang mga pandaigdigang relasyon, na isang malaking bagay para sa mga gawain sa wika at multimodal [3].

Ang "Ano ang Neural Network sa AI?" iba sa "ano ang malalim na pag-aaral"?

Ang malalim na pag-aaral ay ang mas malawak na diskarte na gumagamit ng mga malalim na neural network. Kaya nagtatanong Ano ang isang Neural Network sa AI? ay tulad ng pagtatanong tungkol sa pangunahing tauhan; malalim na pag-aaral ang buong pelikula [1].

Praktikal, medyo may opinyon na mga tip 💡

Mas gusto ang mga simpleng baseline . Kahit na ang isang maliit na multilayer perceptron ay maaaring sabihin sa iyo kung ang data ay natutunan.
Panatilihing maaaring kopyahin ang iyong data pipeline. Kung hindi mo ito mapapatakbo muli, hindi mo ito mapagkakatiwalaan.
Ang rate ng pag-aaral ay mas mahalaga kaysa sa iyong iniisip. Subukan ang isang iskedyul. Makakatulong ang warmup.
ang mga trade-off sa laki ng batch . Ang mas malalaking batch ay nagpapatatag ng mga gradient ngunit maaaring magkaiba ang pag-generalize.
Kapag nalilito, ang mga kurba ng pagkawala at mga pamantayan ng timbang. Magugulat ka kung gaano kadalas ang sagot ay nasa mga balangkas.
Mga pagpapalagay ng dokumento. Kinabukasan-nakakalimutan mo ang mga bagay - mabilis [1, 2].

Deep-dive detour: ang papel ng data, o kung bakit ang pagpasok ng basura ay nangangahulugan pa rin ng basura 🗑️➡️✨

Ang mga neural network ay hindi mahiwagang nag-aayos ng maling data. Ang mga skewed na label, mga pagkakamali sa anotasyon, o makitid na sampling ay mag-e-echo lahat sa modelo. Pag-curate, pag-audit, at pagpapalaki. At kung hindi ka sigurado kung kailangan mo ng mas maraming data o mas mahusay na modelo, ang sagot ay kadalasang nakakainis na simple: pareho - ngunit magsimula sa kalidad ng data [1].

"Ano ang isang Neural Network sa AI?" - maiikling kahulugan na maaari mong gamitin muli 🧾

Ang neural network ay isang layered function approximator na natututo ng mga kumplikadong pattern sa pamamagitan ng pagsasaayos ng mga timbang gamit ang mga gradient signal [1, 2].
Ito ay isang sistema na nagpapalit ng mga input sa mga output sa pamamagitan ng sunud-sunod na nonlinear na mga hakbang, na sinanay upang mabawasan ang isang pagkawala [1].
Ito ay isang flexible, gutom sa data na diskarte sa pagmomodelo na umuunlad sa mga hindi nakaayos na input tulad ng mga larawan, teksto, at audio [1, 2, 3].

Masyadong Mahaba, Hindi Nabasa at huling pangungusap 🎯

Kung may magtatanong sa iyo kung Ano ang Neural Network sa AI? narito ang maikling kwento: ang neural network ay isang salansan ng mga simpleng yunit na unti-unting nagbabago ng data, natututunan ang pagbabago sa pamamagitan ng pagliit ng pagkawala at pagsunod sa mga gradient. Makapangyarihan ang mga ito dahil nag-i-scale ang mga ito, awtomatikong natututunan ang mga feature, at maaaring kumatawan sa mga napakakumplikadong function [1, 4]. Mapanganib ang mga ito kung babalewalain mo ang kalidad ng data, pamamahala, o pagsubaybay [5]. At hindi sila mahika. Matematika, compute, at mahusay na engineering lamang - na may kaunting panlasa.

Karagdagang pagbabasa, maingat na pinili (mga hindi binanggit na mga extra)

Mga tala ng Stanford CS231n - madaling lapitan at praktikal: https://cs231n.github.io/
DeepLearningBook.org - canonical reference: https://www.deeplearningbook.org/
NIST AI Risk Management Framework - responsableng AI guidance: https://www.nist.gov/itl/ai-risk-management-framework
“Atensyon Lang ang Kailangan Mo” - ang papel ng Transformer: https://arxiv.org/abs/1706.03762

Mga Sanggunian

[1] Goodfellow, I., Bengio, Y., at Courville, A. Deep Learning. MIT Press. Libreng online na bersyon: magbasa pa

[2] Stanford CS231n. Convolutional Neural Networks para sa Visual Recognition (mga tala ng kurso): magbasa pa

[3] Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). Atensyon lang ang kailangan mo. NeuroIPS. arXiv: magbasa pa

[4] Cybenko, G. (1989). Pagtatantya sa pamamagitan ng mga superposisyon ng isang sigmoidal function. Matematika ng Kontrol, Mga Senyales at Sistema, 2, 303–314. Springer: magbasa pa

[5] NIST. AI Risk Management Framework (AI RMF): magbasa pa

Hanapin ang Pinakabagong AI sa Opisyal na Tindahan ng AI Assistant

Tungkol sa Amin

Balik sa blog