Sinabi ni Scott Wu ng Cognition na hindi dapat palitan ng mga AI coding agent ang mga tao ↗
Itinanggi ni Scott Wu ng Cognition ang ideya na ang Devin ay ginawa upang palitan ang mga programmer. Medyo nakakailang na paninindigan, dahil sinasabi rin ng kumpanya na malaking bahagi ng sarili nitong code ang inilalaan ng Devin.
Ang framing niya ay mas parang “AI coding buddy” kaysa sa “kinain na ng laptop goblin ang trabaho mo.” Gayunpaman, mahirap pa ring hindi pansinin ang tensyon - mas mahusay na mga ahente, mas kaunting mga dahilan para sa malalaking engineering team… o ganoon nga ang argumento.
Libreng lilinisin ng AI startup na ito ang iyong tahanan para sanayin ang mga robot sa hinaharap ↗
Nag-aalok ang Shift ng libreng paglilinis ng bahay, na may kasamang madaling gamitin at medyo nakakabahala na pantulong: ang mga tagalinis ay nakasuot ng "mahiwagang sumbrero" na may kamera para makakalap ang kumpanya ng datos tungkol sa pagsasanay ng mga robot.
Simple lang ang mungkahi - makakakuha ka ng malinis na flat, makakatanggap sila ng video ng mga gawaing-bahay. Siguro, isang maayos na kasunduan.
Sinasabi ng Shift na pinapalabo nito ang mga sensitibong detalye at ginagawang hindi nagpapakilala ang mga kuha, ngunit ang mas malawak na tanong ay naroon pa rin na parang medyas sa ilalim ng sofa: gaano kalaking privacy sa bahay ang handang ipagpalit ng mga tao para sa kaginhawahan?
Inilabas ng Anthropic ang Claude Opus 4.8 ↗
Inilabas ng Anthropic ang Claude Opus 4.8 na may mga pag-upgrade sa coding, mga daloy ng trabaho ng ahente, pangangatwiran, at propesyonal na trabaho. Ang malaking bentahe ay ang pagiging maaasahan - mas kaunting mga hindi sinusuportahang pahayag, mas mahusay na paggamit ng tool, at mas maraming pagsusuri sa sarili.
Mayroon ding mga dynamic workflow ang Claude Code, na nagpapahintulot sa modelo na magplano, gumawa ng mga parallel sub-agent, mag-verify ng mga output, at mag-ulat pabalik. Mukhang hindi iyon kaaya-aya hanggang sa mapagtanto mo na isa itong simpleng pamamahala ng proyekto.
Nahahati ang presyo sa pagitan ng standard at fast modes, kung saan mas pinipili ng Anthropic ang mga effort controls para makapagpalit ang mga user ng bilis, kalidad, at token burn.
Malaki ang tiwala ng Foxconn sa momentum ng paglago dahil sa AI, sabi ng chairman ↗
Sinabi ng chairman ng Foxconn na binabago ng demand sa AI ang karaniwang ritmo ng kumpanya sa panahon. Ang dating pagbagsak ng suplayer sa kalagitnaan ng taon? Tila hindi na normal ang kilos ngayon.
Ang dahilan ay ang napakalaking paggastos ng mga higanteng kompanya ng cloud sa AI, na nakikita ng Foxconn bilang sarili nitong oportunidad sa merkado. Iyan ang hardware na bahagi ng pag-usbong ng AI, hindi gaanong maganda kumpara sa mga chatbot, ngunit doon talaga tumatalbog ang mga tubo ng pera.
Ang Foxconn ay isa nang pangunahing tagagawa ng server ng Nvidia, kaya ang optimismo nito ay karaniwang isang pagsusuri sa temperatura sa karera ng imprastraktura ng AI.
Isang nakabahaging playbook para sa mapagkakatiwalaang mga pagsusuri ng ikatlong partido ↗
Naglathala ang OpenAI ng gabay sa mga pagsusuri ng third-party AI, na nangangatwiran na ang mga pagsubok ay nangangailangan ng mas malinaw na detalye tungkol sa kung ano ang sinuri, kung paano ito sinubukan, at kung ano ang maaaring patunayan ng mga resulta.
Ang pangunahing punto ay nakakagulat na praktikal: ang mga frontier AI eval ay hindi maaaring maging hula lamang sa hugis ng leaderboard. Kailangang ipaliwanag ng mga evaluator ang nasubukang sistema, mga prompt, mga pananggalang, mga pagsusuri sa bisa, at kung saan natatapos ang mga pahayag.
Mahalaga iyon dahil habang nagiging mas agresibo ang mga modelo, ang mababaw na mga pagsubok ay maaaring magpamukhang mas ligtas o mas malakas ang mga sistema kaysa sa kung sino talaga sila. Maliit na enerhiya sa mga papeles, malalaking kahihinatnan.
Mga Madalas Itanong
Ang mga AI coding agent ba tulad ni Devin ay nilalayong pumalit sa mga programmer?
Inilalarawan ni Scott Wu ang mga AI coding agent bilang mga coding partner sa halip na mga ganap na kapalit para sa mga taong programmer. Gayunpaman, itinuturo ng artikulo ang isang tensyon: Inilarawan din si Devin bilang nag-aambag ng malaking bahagi ng sariling code ng Cognition. Sa praktikal na termino, ang konklusyon ay maaaring mabawasan ng mga tool na ito ang ilang karaniwang gawain sa inhinyeriya habang umaasa pa rin sa mga tao para sa paghatol, direksyon, at pananagutan.
Bakit nag-aalok ang Shift ng libreng paglilinis ng bahay para sa AI training data?
Nag-aalok ang Shift ng libreng paglilinis ng bahay dahil gusto nito ng pisikal na video data ng mga gawaing-bahay upang sanayin ang mga robot sa hinaharap. Ang mga tagalinis ay nakasuot ng "magic hat" na may camera habang nagtatrabaho, na gumagawa ng mga footage na makakatulong sa mga AI system na maunawaan ang mga gawain sa bahay. Malinaw ang palitan: nakakakuha ang mga customer ng malinis na tahanan, habang ang kumpanya ay nakakakuha ng data mula sa mga pribadong espasyo.
Paano pinangangasiwaan ni Shift ang privacy kapag nangongolekta ng mga footage tungkol sa paglilinis ng bahay?
Ayon sa artikulo, inaangkin ng Shift na pinapalabo nito ang mga sensitibong detalye at ginagawang hindi nagpapakilala ang mga kuha. Maaaring mabawasan nito ang ilang panganib sa privacy, ngunit hindi nito inaalis ang mas malawak na alalahanin ng pagre-record sa loob ng mga tahanan ng mga tao. Para sa mga gumagamit, ang pangunahing tanong ay kung ang kaginhawahan ng libreng paglilinis ay sulit ba sa antas ng pangongolekta ng datos.
Ano ang bago sa Claude Opus 4.8?
Ang Claude Opus 4.8 ay inilarawan bilang pagpapabuti ng coding, mga daloy ng trabaho ng ahente, pangangatwiran, at propesyonal na gawain. Ang update ay nakasentro sa pagiging maaasahan, kabilang ang mas kaunting mga hindi sinusuportahang pahayag, mas malakas na paggamit ng tool, at mas maraming self-checking. Nagkakaroon din ang Claude Code ng mga dynamic na daloy ng trabaho, kung saan maaaring magplano ang modelo, magpatakbo ng mga parallel na sub-agent, mag-verify ng mga output, at mag-ulat ng mga resulta.
Bakit mahalaga ang optimismo ng Foxconn sa AI boom?
Mahalaga ang kumpiyansa ng Foxconn dahil sumasalamin ito sa hardware na aspeto ng pag-usbong ng AI. Sinabi ng chairman ng kumpanya na binabago ng demand ng AI ang karaniwang pana-panahong pattern nito, kung saan ang paggastos sa imprastraktura ng mga higanteng cloud ay lumilikha ng isang malaking pagkakataon sa merkado. Dahil ang Foxconn ay isa nang pangunahing tagagawa ng server ng Nvidia, ang mga komento nito ay nagsisilbing isang malakas na senyales para sa demand sa imprastraktura ng AI.
Ano ang sinasabi ng OpenAI na nagpapatibay sa mga pagsusuri ng third-party AI?
Ikinakatuwiran ng OpenAI na ang mga pagsusuri ng AI ay nangangailangan ng mas malinaw na mga paliwanag kung anong sistema ang sinubukan, paano ito sinubukan, at kung ano ang tunay na ipinapakita ng mga resulta. Kabilang dito ang mga detalye tungkol sa mga prompt, pananggalang, pagsusuri ng bisa, at mga limitasyon ng anumang mga pahayag. Ang puntong ito ay lalong mahalaga para sa mga modelong mas agresibo, kung saan ang mababaw na mga pagsubok ay maaaring magmukhang mas ligtas o mas may kakayahan ang mga sistema kaysa sa kung ano talaga sila.