Kan en robot skriva en symfoni? Turing-testet - "Du är bara en robot, en imitation av livet. Kan en robot slå det här spelet? Nackdelar med VR-terapi är de relativt höga kostnaderna för utrustning och potentiell fysiologisk intolerans mot virtuell verklighet.

Utvecklingen av delar av artificiell intelligenssystem utvecklas aktivt och blir en trend i dag, och bara de lata skriver inte smarta bots. Det är därför vi intervjuade Dmitry shwars Soshnikov, en av landets bästa AI-experter. Han är en Microsoft-teknikevangelist, författare till böcker, artiklar och handledning, samt en lärare och studentprogramkoordinator, specialist på funktionell programmering, neurala nätverk och artificiell intelligens.


- Dmitry, berätta några ord om dig själv och ditt arbete.

Dmitry Soshnikov: Som evangelist för Microsoft är jag involverad i att popularisera och implementera företagets modernaste teknologier, nu främst teknologier relaterade till artificiell intelligens. Detta inkluderar att tala på konferenser, arbeta med studenter och lärare, startups, ibland delta i hackfester och programmera prototypsystem tillsammans med utvecklare från olika företag. Jag populariserar även funktionell programmering och F#-språket, undervisar på MIPT, HSE och MAI och utvecklar onlinekurser för MVA och Coursera.

Enligt min mening är neurala nätverk och artificiell intelligens i allmänhet ett mycket intressant område, vars snabba utveckling de senaste åren redan har gjort det möjligt att lösa ett antal problem som tidigare inte hade någon lösning, som till exempel att automatiskt fastställa en persons ålder från hans fotografi. Och framtiden har många fler intressanta möjligheter för oss.

Neurala nätverk - mode eller verktyg?

- Exakt vad har nyligen föranlett den aktiva utvecklingen av neurala nätverksteknologier?

Dmitry Soshnikov: Flera faktorer överlappade framgångsrikt här.
Först blev prisvärd datorkraft tillgänglig. Dessutom spelade molntjänster en stor roll, eftersom istället för att investera i infrastruktur för beräkning av neurala nätverk kan du nu bara hyra den under beräkningarnas varaktighet, och sedan vägra att hyra. Dessutom började grafikprocessorer, som ursprungligen var designade för datorgrafik, användas. Det visade sig att de är väl lämpade för artificiell intelligens uppgifter.

För det andra, tack vare Internet, har gigantiska mängder data börjat samlas på många områden. Tänk till exempel på den tidigare nämnda uppgiften att känna igen en persons ålder från ett fotografi. För att träna ett neuralt nätverk för att lösa det krävs flera hundra tusen exempel. Nu kan du ta vilket socialt nätverk som helst där människor själva publicerar sina bilder och kontoinformation (ålder) – och vi får omedelbart data för träning.
För det tredje har naturligtvis en del intressant forskning dykt upp, inklusive nya neurala nätverksarkitekturer som tillåter att lösa befintliga problem. Men denna punkt är förmodligen en konsekvens av de två första. När resurser och teknik finns tillgängliga börjar området naturligtvis utvecklas aktivt.

Ett stort antal verktyg har också dykt upp här som gör att dessa neurala nätverk kan användas. Om du tidigare för att lösa problem med artificiell intelligens var tvungen att ha mycket kunskap och mycket programmering, nu finns det tjänster tillgängliga som du kan ta och använda.

Ämnet artificiell intelligens är mycket populärt idag. Hur mycket av denna popularitet är värd? Är tekniken verkligen så imponerande eller är det ett stort bidrag från modet? Och är inte detta "mode" skadligt för utvecklingen?

Dmitry Soshnikov: Det finns verkligen stora framgångar inom AI-området, som det skrivs mycket om, så frasen "artificiell intelligens" hörs allmänt. Tack vare detta dyker det upp nya utvecklare - någon går och studerar ett nytt område för sig själv, d.v.s. Det finns fler som förstår det här området. Å andra sidan letar människor mer noggrant efter de uppgifter där artificiell intelligens kan tillämpas. Ur denna synvinkel är allt detta i princip bra, eftersom vi har en chans att automatisera vissa områden som vi inte kunde automatisera tidigare.

Vi kan till exempel lösa problemet med att ta emot beställningar i MacAuto-fönstret. De försöker alltid göra lösningen på sådana problem billigare. Till exempel i USA satt först en amerikan där, sedan försökte man lägga ut detta på entreprenad genom att överföra rösten till ett land med billig arbetskraft (där återigen personen sitter och transkriberar). Och nu kan en dator göra detta.

Har marknadsaktörerna uppblåsta förväntningar? Finns det några förutsägelser som, enligt din åsikt, definitivt inte kommer att gå i uppfyllelse inom en snar framtid?

Dmitry Soshnikov: Självklart har. Först och främst är området artificiell intelligens lite romantiskt. Det finns en hel del filmer - till exempel "The Matrix" eller "Terminator" - där robotar gör uppror och tar kontroll över allt. Därför finns det ett visst antal människor som räknar med att ytterligare 5 år kommer att gå och datorer tar över världen. Dessa förväntningar är tydligen fortfarande långt ifrån verkligheten. Nuförtiden är lösningen av vissa klasser av problem relaterade till bildigenkänning, taligenkänning och maskininlärning mycket väl automatiserad. Men vi har fortfarande ganska långt kvar innan vi förstår hur mänskligt tänkande fungerar i allmänhet. Därför, innan du skapar en sådan artificiell intelligens som kommer att tänka som en person och arbeta med ackumulerad kunskap, måste mycket arbete fortfarande göras. Det är ännu inte särskilt klart hur man gör detta.

- Hur är det med förväntningarna när det gäller finansiella investeringar, snarare än genomförandet av science fiction-scenarier?

Dmitry Soshnikov: Det verkar för mig att för en sådan konversation är det nödvändigt att dela upp ämnet artificiell intelligens i separata komponenter, eftersom det är ett mycket brett område.

Om vi ​​tittar på datorseende finns det redan fantastiska framsteg som nu implementeras i företag, vilket ökar deras effektivitet och ger ekonomiska fördelar. Datorseende känner redan igen bilder bättre än människor, för att inte tala om att det är betydligt billigare.

Inom andra områden, som att förstå naturligt språk och förmågan att resonera kring godtyckliga ämnen, har framstegen varit mer blygsamma.

– Finns det faktorer som enligt dig hindrar branschens utveckling?

Dmitry Soshnikov: För att vara ärlig ser jag inga uppenbara faktorer. Jag tror att detta är det område som växer snabbast just nu.
Jag vill dock notera att artificiell intelligens är ett område som fortfarande kräver vissa kvalifikationer. Att arbeta i den här riktningen är lite svårare än att bara lära sig programmera. En person som går ut skolan och inte får en högre utbildning kan troligen börja arbeta framgångsrikt inom området standardutveckling. Med artificiell intelligens är ribban för inträde högre, även om den gradvis sänks, bland annat genom insatser från deltagare i denna bransch. Särskilt en av de saker som Microsoft arbetar med är den så kallade demokratiseringen av artificiell intelligens. Detta innebär att göra tekniken tillgänglig för största möjliga segment av konsumenter.

I praktiken arbetar inte bara Microsoft utan även många andra företag i denna riktning och tillhandahåller till exempel verktyg för att lösa intellektuella, kognitiva problem i form av färdiga tjänster. Till exempel tjänster för att bestämma en persons kön, ålder och humör från ett fotografi; du kan helt enkelt ringa dem och få resultatet. Detsamma gäller maskinöversättning m.m. Som en del av rapporten på DotNext 2017 kommer vi att prata om detta: hur kan du, utan att alls förstå hur exakt det fungerar, helt enkelt använda resultaten.

A.NET kanske?

– Låt oss prata om .NET-plattformens plats i segmentet artificiell intelligens. Hur lämplig är den för att lösa sådana problem? Finns det några funktioner som hjälper eller omvänt hindrar arbetet med neurala nätverk?

Dmitry Soshnikov: AI-metoder kan implementeras på vilken teknik som helst. Ändå finns det vissa etablerade ekosystem kring liknande uppgifter. Till exempel är Python och R och deras medföljande bibliotek mycket populära språk bland dataforskare. De där. det finns redan mycket samhällsarbete här. När det gäller denna utveckling ligger naturligtvis .NET lite efter, liksom andra liknande plattformar. Men .NET har redan en viss uppsättning verktyg, som jag kommer att prata om som en del av min rapport.

I allmänhet är plattformar nu i någon mening integrerade, inklusive med varandra. Samma R-språk integreras mycket bra med F#, som är inbyggt i .NET-plattformen. Följaktligen, om vi behöver använda några verktyg för maskininlärning, kan vi använda en sådan kedja, med hjälp av funktionerna och biblioteken i språket R. Detta kommer att vara ganska transparent och lätt att göra.

I allmänhet, om vi pratar specifikt om neurala nätverk, har Microsoft en Cognitive Toolkit som låter dig träna neurala nätverk. Och eftersom det ursprungligen byggdes i Microsofts ekosystem fungerar det mycket bra med .NET.

– Det här verktyget skiljer sig på något sätt från analoger från andra tillverkare?

Dmitry Soshnikov: I huvudsak är Cognitive Toolkit Microsofts analog till TensorFlow, Caffe, etc. ramverk.

Alla är i princip väldigt lika ideologiskt. Men Microsoft Cognitive Toolkit var först med att stödja en högdistribuerad träningsmiljö, där du kan träna ett neuralt nätverk inte bara på en enda GPU, utan på flera GPU:er eller till och med flera GPU-stationer. De där. Du kan göra en träningsgård för neurala nätverk.

Så vitt jag vet slår Cognitive Toolkit andra ramverk när det gäller inlärningshastighet. Dessutom är den väldigt bekväm att använda. De flesta ramverk är relaterade till Python-språket på ett eller annat sätt, men Cognitive Toolkit tog initialt en lite annan väg. Det var från början möjligt att beskriva arkitekturen för ett neuralt nätverk på ett speciellt språk och sedan träna upp det utan att bygga några modeller i Python. Det var lite lättare. För närvarande stöder Cognitive Toolkit båda alternativen, dvs. är ganska flexibel.

- Förmodligen finns det ögonblick då Cognitive Toolkit är sämre än sina analoger?

Dmitry Soshnikov: Generellt sett är sådana ramverk lågnivåverktyg ovanpå vilka godtyckliga neurala nätverk kan tränas. Liksom sina analoger stöder Cognitive Toolkit ett visst baslager på vilket du kan bygga arkitekturen för nätverk av godtycklig komplexitet. Därför är utbudet av uppgifter som löses med olika verktyg ungefär detsamma.

Valet av ram bestäms till stor del av vissa personliga preferenser och tillgången på referensmaterial. Och här släpar Microsoft-ramverket lite efter, eftersom det dök upp lite senare, så det finns inte så stor mängd material på det, i synnerhet onlinekurser. Men situationen planar förstås gradvis ut.

Vi, tillsammans med MIPT, planerar att släppa en onlinekurs dedikerad specifikt till problemen förknippade med användningen av artificiell intelligens i praktiken. Och en del av informationen om Cognitive Toolkit kommer också att finnas med där.

Nära framtid

– Går det att förutse nu i vilken riktning utvecklingen av det artificiella intelligenssegmentet går?

Dmitry Soshnikov: Det är förmodligen för tidigt att göra slutliga prognoser, eftersom den extremt snabba utvecklingen av teknik började 2011-2012. Sedan dess har igenkänningsmetoderna förbättrats, neurala nätverksarkitekturer har förbättrats, d.v.s. noggrannheten i problemlösning ökar.

Det finns fortfarande många olösta problem inom detta segment. Problemen med bild- och röstigenkänning har redan lösts på en ganska hög nivå. Därefter är förmodligen det mest intressanta att försöka få fram någon mening ur texten. Det finns några ganska fantastiska framgångar här också. Du kan till exempel träna ett neuralt nätverk på fragment av konversationer från filmer och få en robot som på något sätt kan upprätthålla en dialog. Men samtidigt blir det inte så mycket mening i dialogen. Det är ännu inte klart hur man översätter kunskap till mening, hur man kombinerar den implicita representationen av kunskap i neurala nätverk med symboliskt resonemang. Detta är den inriktning av forskning som forskarna kommer att driva.

När det gäller verktygen utvecklas de för närvarande aktivt. På sätt och vis försöker verktygstillverkare följa vetenskapliga framsteg inom sina respektive områden. Nya nätverksarkitekturer dyker upp - deras stöd visas i verktyg, d.v.s. Funktionaliteten utökas hela tiden.

Som jag sa tidigare, från en utvecklares synvinkel, finns det en märkbar trend mot demokratisering av artificiell intelligens, inklusive verktyg. Förutom Microsoft Cognitive Toolkit som jag nämnde, finns det ett intressant verktyg som heter Azure Machine Learning, som låter dig tillämpa dem på riktiga data utan en djup förståelse för implementeringen av alla maskininlärningsalgoritmer och se om du kan identifiera några mönster och använd dem vidare i dina produkter. Även detta verktyg utvecklas ganska intensivt - nya metoder och algoritmer introduceras där.

Generellt sett blir tekniken mer tillgänglig. Komplexa saker förenklas så att de kan användas i så många olika projekt som möjligt.
En annan punkt som jag skulle vilja nämna är att dessa fortfarande är de första experimenten i molnet med mer effektiva hårdvarulösningar som implementerar artificiell intelligensalgoritmer. Vi kommer inte att prata om detta på Dotnext, men ämnet diskuterades i detalj på Microsoft Ignite-konferensen. I molnet planerar Microsoft att erbjuda inte bara klassiska datorresurser utan även programmerbara logiska integrerade kretsar: FPGA eller FPGA. För att förenkla är dessa chips som kan flashas för att utföra vissa logiska operationer, och som kommer att utföra dessa operationer mycket snabbt. Med ett sådant schema kan vi beräkna det neurala nätverket mycket snabbare. Under experimenten "ombads" processorn att översätta från språk till språk, som ett resultat av att romanen "Krig och fred" översätts från språk till språk på 2 sekunder. Om man tar alla många sådana processorer som Microsoft har i molnet, så kan Wikipedia översättas från ett språk till ett annat på den tid det tar en person att blinka med ett öga.

Dmitry kommer att ge mer praktisk information om användningen av neurala nätverk och artificiell intelligens i verkliga projekt (inklusive på .NET) i sin rapport på DotNext 2017 Piter ("Tillgänglig artificiell intelligens på .NET-plattformen: från chatbots och kognitiva tjänster till djupa tjänster neurala nätverk").

Taggar: Lägg till taggar

Turing-testet är i huvudsak ett test som svarar på frågan "kan maskiner tänka?" Det vill säga, detta är en uppsättning tester som bara en person eller perfekt artificiell intelligens som kan tänka på samma sätt kan klara. Detta är precis vad vi ombeds göra i spelet - att bevisa att du är en Homo sapiens. Enligt mig är detta en principfråga!

De som gillade pusslen The Talos Principle and Portal kommer definitivt att uppskatta Turingtestet. Dessa spel har verkligen mycket gemensamt. Man kan till och med säga att de bildar en separat subgenre, som kommer från just portalen.

Passagen är en uppsättning logiska tester som måste lösas sekventiellt. Grunden för spelmekaniken i Turingtestet gör upp energisfärer som behöver sättas in i speciella celler för att öppna dörrar, starta mekanismer osv. Det enda verktyget som hjälper i denna fråga är en viss magnetpistol som kan absorbera dessa sfärer och skjuta dem på rätt plats.

Det finns mer än 70 test totalt, men många av dem genomförs på bara några sekunder. Därför tar inte hela passagen mycket tid. I allmänhet finns det få svåra hinder i spelet, de flesta av dem kan slutföras nästan i farten. Vissa människor kanske tycker att pusslen är för enkla, men jag gillade svårighetsbalansen. Tvärtom, jag gillar inte att vara "dum" under lång tid i sådana spel.



Den allmänna idén liknar också de spel som inspirerade utvecklarna. Filosofiska och etiska överväganden om intelligens, om skillnaden mellan människa och maskin.

När det gäller själva handlingen: huvudpersonen befinner sig på en rymdstation på Europas snöiga yta, en satellit från Jupiter. Baspersonalen har försvunnit, och allt styrs av artificiell intelligens, som möter hjältinnan. Hon måste klara just detta Turing-test och ta reda på vad som hände med människor. Berättelsen är ganska intressant, men den presenteras i så små bitar (ett par datorrader i början av varje nivå) att du inte märker det under nästan hela spelet och bara uppmärksammar mot slutet.

Kan en robot skriva en symfoni eller förvandla en duk till ett konstverk? Denna fråga förblir öppen. Men här är vad vi säkert vet: moderna medicinska nanorobotar kan "klippa av syret" från en tumör genom att penetrera blodomloppet och leverera läkemedel till de drabbade cellerna utan att skada friska. Neurala nätverk är på väg att överträffa läkare när det gäller att diagnostisera många sjukdomar, och undersökningar med CRISPR-teknologier kan snart utföras utan att lämna hemmet. Medicinens framtid har redan anlänt - låt oss ta reda på vad vi kan förvänta oss av nya metoder och hur detta kommer att påverka vår hälsa.

Diagnostisera det: Artificiell intelligens

Framgången för behandlingen beror till stor del på snabb och felfri diagnos: för detta måste läkaren samla på sig mycket praktisk erfarenhet och vara medveten om aktuella vetenskapliga arbeten inom sitt område. Men med så många nya studier och fallrapporter som dyker upp i tryck varje månad, var kan du hitta tid att studera allt? Det är här datorer kommer till hjälp för människor, som kan bearbeta enorma mängder information på några sekunder.

Idag skapas algoritmer för att analysera medicinsk data av stora företag, inklusive Microsoft, IBM och Google. Oftast är deras utveckling baserad på olika former av självlärande artificiell intelligens som kan hitta mönster i stora datamängder, som hjärnskanningar eller bilder av misstänkta utväxter på huden. Sådana algoritmer tränas med hjälp av bibliotek med tusentals exempel, där varje bild tilldelas en diagnos gjord av en kvalificerad läkare.

Neurala nätverk har redan lärt sig att identifiera många sjukdomar lika effektivt som människor, och i vissa fall lyckas de till och med överträffa specialister.

Convolutional neural networks (CNN) låter dig analysera flera bilder. Dessa är djupa (flerlagers) strukturer där varje artificiell neuron endast tar emot ett litet fragment av resultatet från det föregående lagret. Gradvis generaliserar nätverket lokala funktioner och återskapar hela bilden. Genom att kombinera all data kan CNN känna igen olika detaljer i originalbilden, inklusive karakteristiska element baserat på vilka läkare ställer en diagnos.

CRISPR-teknologier kan inte bara eliminera orsakerna till sjukdomar, utan också identifiera sjukdomar, till exempel leta efter spår av DNA eller RNA från smittämnen.

Medan det CRISPR-associerade proteinet Cas9 oftast nämns i samband med terapi, är andra proteiner: Cas12a och Cas13a vanligtvis de "diagnostiska" proteinerna.

Under 2017 introducerade forskare från MIT en diagnostisk teknologi som heter SHERLOCK (Specific High Sensitivity Enzymatic Reporter UnLOCKing). Den använder enzymet Cas13a, som kan känna igen specifika RNA-sekvenser och skära av liknande RNA-strängar som finns i närheten, vilket fullständigt förstör det misstänkta föremålet. Liksom boken Sherlock Holmes kan den medicinska SHERLOCK återskapa en komplett bild av händelser från minsta bevis: tekniken fungerar med atomolära (10–18 mol per liter) koncentrationer av nukleinsyror. Metoden testades på lentivirus innehållande fragment av denguefeberviruset och Zikaviruset: SHERLOCK kunde detektera patogenpartiklar och särskilja dem från varandra vid en koncentration av högst två attomoler.

Vid testning visade det sig att reagenser för diagnostik med SHERLOCK kan torkas och sedan rekonstitueras, samtidigt som metodens känslighet inte minskar mycket. För bärbara tester rekommenderas att använda glasfiberpapper. Författarna till utvecklingen tror att ett testsystem kommer att kosta cirka 61 cent.

Andra forskare arbetar också med att skapa kit för CRISPR-testning hemma. Nyligen startade utvecklingen inom detta område av Jennifer Doudna, en av pionjärerna inom den medicinska CRISPR-revolutionen. Hennes team skapade en metod som heter DETECTR (DNA-endonukleas-targeted CRISPR trans reporter), med hjälp av Cas12a-proteinet. Den hittar specifika DNA-sekvenser och skär de närmaste fluorescensmärkta nukleinsyrareportermolekylerna som lagts till provet, vilket ger en signal. På så sätt kan spår av patogener från många sjukdomar upptäckas, inklusive olika stammar av influensaviruset.


Enligt skaparna av sådana testsystem tar CRISPR-analys inte längre än några timmar, och resultaten kan erhållas via Internet. Det är dock fortfarande okänt när sådana uppsättningar kommer att dyka upp till offentlig försäljning.

Det är en illusion: virtuell verklighet

Virtuell verklighet pratas ofta om i dataspelssammanhang och "3D-bio", men tekniken har också potential inom medicin, och inte inom de mest uppenbara områdena. Till exempel används VR effektivt som smärtstillande medel.

Brännskadaenheten vid Loyola University Hospital i Illinois tar detta tillvägagångssätt.satte igång användes för tio år sedan: sjukhuspatienter spelar en simulator under smärtsamma ingreppSnowWorld.

Handlingen utspelar sig mot bakgrund av halvfantastiska norrländska landskap med många snödrivor och frusna floder, hjältens uppgift är att spela snöbollar med isbjörnar, pingviner och snögubbar. För att klara alla nivåer fokuserar patienten ofrivilligt på pusslet och distraheras från fysiska förnimmelser. Hjärnskanningar med magnetröntgen har visat att SnowWorld faktiskt minskar uppfattningen av smärta, så patienter behöver färre starka smärtstillande medel som kan vara skadliga för kroppen.

VR ersätter eller kompletterar smärtstillande läkemedel inom många områden inom medicinen. Tekniken används för att lindra smärta under förlossningen och vid tandingrepp. De smärtlindrande egenskaperna hos virtuell verklighet är särskilt relevanta i ljuset av "opioidkrisen" i USA - den är förknippad med den ökade populariteten för receptbelagda smärtstillande medel (till exempel OxyContin och Vicodin) under de senaste decennierna.

VR fungerar inte bara för fysisk smärta: den kan också övervinna psykiska trauman. De första experimenten ägde rum i slutet av 1990-talet, när psykologen Barbara Rothbaum lyckades lindra symptomen på posttraumatiskt stressyndrom hos Vietnamveteraner med hjälp av virtuella modeller av en helikoptercockpit och en glänta i den asiatiska djungeln. Denna teknik kompletterade exponeringsterapi - en gradvis "inställning" till traumatiska minnen som patientens medvetande försöker undvika. Ett liknande schema fungerar vid behandling av ångestsyndrom och fobier med hjälp av virtuell verklighet. Tekniken hjälper till att hantera aerofobi och rädsla för att tala inför publik: en simulerad miljö gör det möjligt att upprepade gånger "öva" en skrämmande situation.

Nackdelarna med VR-terapi är de relativt höga kostnaderna för utrustning och potentiell fysiologisk intolerans mot virtuell verklighet.

Vissa deltagare i försök med nya behandlingsmetoder upplevde VR "illamående" (virtuell verklighetssjuka), vilket orsakar samma symtom som åksjuka eller sjösjuka. Enligt vanliga hypoteser uppstår båda störningarna av störningar i funktionen hos receptorerna i den vestibulära apparaten eller en konflikt mellan signaler som kommer från den vestibulära apparaten och synorganen.

Utvecklare har redan skapat flera metoder som kan minska VR "illamående". Till exempel kan du placera ett stillastående föremål på skärmen som användarens ögon kommer att fixera konstant. Författarna till Nasum Virtualis-tekniken föreslår att använda en virtuell bild av näsan placerad i mitten av skärmen som referenspunkt. Spelarens ögon uppfattar det som sin egen näsa, så känslan av illamående och yrsel avtar.