Neural network
A neural network is an interconnected
assembly of simple processing units or nodes, whose functionality is based on a
brain. The processing ability of the network is stored in the connection
strengths (or weights) between the units. These weights are obtained by a
process of adaptation to a set of training patterns. Theory of
neural networks is termed connectionism
and represents an alternative to
the symbolic representational paradigm (or rule based paradigm) in
Artificial Intelligence.
The computing paradigm associated with neural networks is also termed Artificial Neural Networks (ANN), the Theory of Neural Computation, Connectionism, Neurocomputing and Parallel Distributed Processing.
Literature:
Arbib, M. A. & Buhmann, J. (1992). Neural networks. Vol. 2, pp. 1016-1060
IN:
Encyclopedia of Artificial Intelligence. Second Edition. Ed by Stuart C. Shapiro
et al. New York: John Wiley & Sons, Inc. Vol. 1-2.
Bernsen, N. O. & Ib Ulbæk, I. (1993). Naturlig og kunstig intelligens. Introduktion til Kognitionsforskningen. København: Nyt Nordisk Forlag Arnold Busck.
Brunak, S. & Lautrup, B. (1988). Neurale netværk. Computere med intuition. København: Munksgaard.
Campanario, J. M. (1995). Using neural networks to study networks of scientific journals. Scientometrics, 33(1), 23-40.
Chen, H. (1995). Machine learning for information retrieval:
neural networks, symbolic learning, and genetic algorithms. Journal of the
American Society for Information Science, 46(3), 194-216.
Chen, H. & Ng, T. (1995). An algorithmic approach to concept exploration in a large knowledge network (automatic thesaurus consultation): symbolic branch-and-bound search versus connectionist Hopfield Net Activation. Journal of the American Society for Information Science, 46(5), 348-69.
Deffner, Renate; Geiger, Hans: Associative word recognition with connectionist architectures. (Pp 80-87 In: Tools for knowledge organisation and the human interface. Proceedings of the 1st International ISKO Conference, Darmstadt, 14-17 August 1990.
Doszkocs, T. E.; Reggia, J.; Xia, L. & Lin, X. (1990). Connectionist models and information retrieval. Annual Review of Information Science and Technology, volume 25, 209-260.
Feiten, B.; Gunzel, S.: Automatic indexing of a sound database using
self-organizing neural nets. Computer Music Journal, 18(3), 1994, 53-65.
Fogh Kirkeby, O. & Tambo, T. (1992). Guds Ur. Om Den Store Videnskab og dens
kulmination i Computere og Neurale Netværk. København: Gyldendal.
Hebb, D. O. (1949). The Organization of Behavior. New York: John Wiley & Sons, Inc.
Ford, N. (1989). From information-to knowledge-management: the role of rule induction and neural net machine learning techniques in knowledge generation. Journal of Information Science, 15(4/5), 299-304.
Jennings, A. & Higuchi, H. (1992). A browser with a neural network user model. Library Hi Tech, 10(1-2), 77-93.
Lelu, A. (1991). From data analysis to neural networks: new prospects for efficient browsing through databases. Journal of Information Science, 17(1), 1-12.
Moisl, H. (1995). Artificial Neural Networks and Natural Language Processing. Pp
1-42 IN: Encyclopedia of Library and Information Science. Vol. 55, supplement
18. Ed. by Allen Kent. New York: Marcel Dekker, inc.
Ridley, M. (1993). Neural networking (computer prediction of capital markets). The
Economist, v. 329, n7832, pF19(3), october 9, 1993.
Rummelhart, D. E.; McClelland, J. L. & the PGP-group (1986). Parallel Distributed Processing, Vol. 1-2. The MIT Press.
Smith, L. (1996). An Introduction to Neural Networks. http://www.cs.stir.ac.uk/~lss/NNIntro/InvSlides.html
Wikipedia, the free encyclopedia. (2005). Neural network. http://en.wikipedia.org/wiki/Neural_network
Wilkinson, R.; Hingston, P. & Osborn, T. (1992). Incorporating the vector space model in a neural network used for document retrieval. Library Hi Tech, 10(1-2), 69-75.
Journal: Neural Networks. New York: Pergamon Press, 1988- (Official journal of
The International Neural Network Society.
Birger Hjørland
Last edited: 24-02-2007
to be edited:
Neurale net er en form for edb-teknologi, der er udformet efter en analogi til
neurologiske strukturer. Funktionen er karakteriseret ved, at der ikke foregår
en eksplicit problem- og vidensrepræsentation og algoristisk løsning, men
netværket indstilles eller reguleres efter feed-back på nettets ydelser. På
denne måde kan nettet lære f.eks. mønstergenkendelse. I den mere
populærvidenskabelige litteratur har Neurale net været betegnet "komputere med
intuition" med betoning af deres "evne til at associere, oplære sig selv og
skabe ny viden". Teoretisk har de neurale net indenfor forskning i *kunstig
intelligens bevirket en modstrøm i forhold til det *kognitive paradigme, der
betegnes "connectionisme".
Neurale Net (engelsk: Neural Networks, NN) kan referere til biologiske hjerner
eller (lidt upræcist) til kunstige komputerstrukturer/programmer. De kunstige
komputer neurale netværk betegnes når man skal være præcis på engelsk
"artificial neural networks" ("ANNs"). Det princip i databehandling, der her
bygges på betegnes også "connectionisme" (fra det latinske ord for forbindelse)
eller "parallel distributed processing" (PDP). ANNs er naturligvis idealiserede
modeller af biologiske nervesystemer. Hardwaremæssigt er der udviklet særlige
datamaskiner til ANNs, men der er også mulighed for software-simulering og det
almindelige er, at ANN kører på almindelige computere. Det er således muligt at
afprøve mange ANNs på en almindelig PC (der jo fungerer efter det modsatte:
"*symbolske princip").
Teknik: Konnektionistiske systemer består af større netværk af simple
databehandlingsenheder, "kunstige neuroner", der arbejder parallelt. De
kunstige neuroner er stærkt idealiserede og forenklede udgaver af den biologiske
neuron. Enhederne kan være inputenheder, outputenheder eller såkaldte skjulte
enheder, der sender output videre i systemet. De skjulte enheder implementerer
systemets interne repræsentationer.
Hver enhed har en aktiveringsværdi. Disse kan være diskrete eller kontinuerte,
begrænsede eller ubegrænsede. Hvis de kun kan antage værdierne 0 og 1 er der
eksempelvis tale om et diskret, binært system.Forbindelser imellem enhederne har
nummeriske vægte. Vægten kan være positiv (forstærkende, excitatorisk) eller
negativ (hæmmende, inhibitorisk) ligesom rigtige neurale forbindelser.
Forbindelsesmønstret og vægtene udgør på en gang systemets vidensbase og dets
"program" til informationsbehandling. Konnektionistiske komputere skelner altså
ikke som de symbolske imellem en passiv hukommelse og et aktivt program.
Input kan kombineres efter forskellige principper, f.eks. kan input fra flere
enheder adderes eller multipliceres, eller der kan være en tærskelværdi. En
meget brugt funktion er S-formet, d.v.s. en opblødning af det diskrete binære
systems trinfunktion. Neurale nets arkitekturer rummer meget store
frihedsgrader, og et neuralt net kan i princippet også simulere den klassiske
serielle computer.
Repræsentationen i neurale net kan være lokal eller distribueret. Ved lokal
repræsentation repræsenterer det enkelte neuron et bestemt bogstav, begreb,
ordre eller andet. Distribueret repræsentation udnytter hardwaren bedre og giver
desuden langt større robusthed.
Historie: Arbib & Buhnann (1992, side 1016) påpeger, at forskning i *kunstig
intelligens voksede ud af neurale net, *kybernetik, *informationsteori og
automatteori. McCulloch og Pitts havde allerede i begyndelsen af fyrrene vist,
hvordan simple neurale net kunne udføre databehandling. Donald Hebb inspirerede
i 1949 med en idé om, hvordan sådanne systemer kunne indlære ny information. I
1960'erne og 1970'erne dominerede det serielle symbol-manipulerende paradigme,
men i 1980 fremkom en fornyet interesse for distribueret databehandling og
neurale net.
Menneske-maskine-menneske: ANNs er naturligvis inspireret af NNs, velnok det
tydeligste eksempel på hvordan analogi-tænkning imellem menneske og maskine har
inspireret AI-forskningen. En af hovedinspirationskilderne var psykologen Donald
O. Hebb, der i 1949 publicerede bogen "The Organization of Behavior", der blev
en central inspirationskilde for mange komputermodeller over indlæring og
adaption. Bogen forklarer indlæring hos mennesker ved dannelsen af
celle-ansamlinger i hjernen. Hebbs forklaring af indlæring er en variant af
klassisk betingning (Pavlow) og han mente, at forbindelsen imellem to neuroner
styrkes såfremt begge neuroner affyrer deres elektriske impuls på samme tid.
Sådan et skema tenderer imod at skærpe en neurons prædisposition "uden en
lærer", idet den kommer til at affyre sine impulser i bedre og bedre
overensstemmelse (korrelation) med en klynge af stimulus mønstre. Det endelige
sæt inputvægte til neuronen afhænger såvel af de forhåndsvægte/indstillinger
såvel som af de stimulusmønstre, der har påvirket neuronen.
Man skelner imellem modeller henholdsvis med og uden "lærer" (supervisor).
"Unsupervised learning" foregår uden nogen eksplicit reference til nogen
performance-indikator. Klyngedannelsen af neuroner sker i overensstemmelse med
et eller andet indbygget kriterium for lighed, således at dette lighedskriterium
fungerer en fikseret, indbygget supervisor. Modsætningsvis foregår "supervised
learning" ved at omgivelserne eller "læreren" specificerer den korrekte
klassifikation.
Udfra komputermodeller, hvor komputere behandler kognitive processer som
perception og sprog ved hjælp af ANNs, kan man vende tilbage til mennesket og
afprøve teorier om det menneskelige kognitive system (f.eks. har man modeller
for "low level vision"). Så forskning i neurale net og konnektionisme viser,
hvordan AI-forskningen kan gå frem og tilbage mellem menneske og maskine og
bygge videre på sine teorier og modeller.
Erkendelsesteori: Fogh Kirkeby & Tambo (1992, s. 126-127) skriver bl.a.:
"At opnå evnen til at takle denne [parameter-tæthed i realistiske opgaver],
forestiller forskningen i neuale netværk sig, kan er erhverves gennem
sammenkoblingen af mange netværk. Sit billede af erfaring og erkendelse tro har
man et billede af systemets simulering af omverdenen, der begynder ved sansedata
og ender ved begreber. Denne vej, af hvilken man forestiller sig at kunne nå til
implementering af kognitivt tunge opgaver, svarer i praksis til at bygge neurale
netværk-systemer oven på hinanden. Men som vi har set forudsætter det, at man
kan komme fra eksempler til viden på en forholdsvis systematisk og ukompliceret
måde. Et forhold, der på ingen måde kan lade sig gøre, ikke blot på grund af
kontekst-begrebet, men også fordi viden om viden, refleksivitet, ikke blot kan
betragtes som et fænomen, der er resultat af stigende parameter-kompleksitet.
Som vi har set i det foregående ligger teorien om de neurale netværk klart inden
for Den Store Videnskabs tradition. Billedet af bevidstheden svarer til en naiv
empirisme, hvor alle begreber opfattes som betingede af sanseoplevelser.....
....
Alt i alt er teorien om de neurale netværk som forskningsprogram vulgært. Vulgær
i betydningen uden enhver fornemmelse for kvaliteten i den viden, der er blevet
udviklet inden for filosofi, videnskabsteori og moderne videnskab".
Ovenstående er næsten, men ikke helt korrekt, idet D.O. Hebb, som vi har set
anerkender et medfødt moment: at neuroner på forhånd kan være udstyret med vægte
eller mere eller mindre udbyggede forbindelser til andre neuroner.
Betingelserne for, at neurale net kan skaffe den fornødne viden gennem induktion
og generalisation anfører Fogh Kirkeby & Tambo (1992, s. 122):
"A. At det er muligt at finde relevante eksempler i forbindelse med et givet
problem.
B. At det er muligt at give programmet metoder til at skelne mellem relevansen
af de forskellige parametre indbygget i eksemplet, således at det væsentlige ved
postkasser mindre er deres afstand over jorden og deres farve, end de
egenskaber, der udtrykker deres funktion, altså en sprække til breve, et aflåst
rum, en tidsangivelse for tømning etc.
C. At der kan gives et kriterium for, hvornår man har "nok" eksempler til at
danne grundlag for en generel konklusion.
Disse kriterier er ofte komplicerede matematiske vurderinger af sandsynlighed".
Anvendelse: Det forhold, at ANN bygger på eksempler, gør dem velegnede til
genkendelses- og klassifikationsmekanismer. De anvendes f.eks. på slagterier til
sortering af kød, i medicin til blodtypebestemmelse, i økonomi til bestemmelse
af kursudsving m.v.
Ridley (1993) omtaler neurale netværk og skriver, at de nu er næsten ligeså
meget en standard kedelige som regneark. Der er adskillige til salg på det
kommercielle marked. Til finianciel markedsanalyse er der mindst 20. De
billigste koster 100 USA. De er gode til at finde mønstre i tidligere
begivenheder, men de er kun så gode som de mennesker, der programmerer dem og
bruger dem. De danner mønstre fra et datasæt og generaliserer det. Achilleshælen
er, at neurale net tenderer imod "overfit", d.v.s. de finder et eller andet
møster, uanset hvor uægte eller tilfældigt det er. Hvis den har
temperaturanalyser for de sidste to år og de koldeste dage tilfældigvis var
torsdage, vil ANN forudsige at imorgen vil blive kold, fordi det er torsdag. Det
kan et menneske hurtigt indse er noget vrøvl. ANNs tenderer imod at være
skrøbelige, deres konklusioner mangler subtilitet. Det kan ikke skelne imellem
et råd baseret på et snævert sæt betingelser og på et alment princip.
I modsætning til genkendelses- og klassifikationsmekanismer er neurale net
uegnede til at behandle uventede input eller "teoriskifte".
Anvendelse i BDI-området: Indenfor *informationsvidenskab har neurale net især
været foreslået til *information retrieval. Af fordele har været fremhævet, at
brugeren ikke eksplicit behøver formulere sit spørgsmål i en søgeprofil, men
blot kan indikere hvilke dokumenter, der er relevante, så vil nettet selv lære
at identificere disse. Ulemperne er tilsvarende på den ene side, at
søgekriterierne ikke er synlige, brugeren foretager ikke en bevidst strategi, og
ved derfor ikke præcist, hvorfor noget er fundet, eller hvad der ikke er fundet.
Desuden bygger tankegangen på en filosofi, der implicerer, at tidligere
søgninger har samme relevanskriterier som fremtidige søgninger. Det ovenfor
omtalte forhold med uventede input eller "teoriskifte" sætter sine store
begrænsninger på anvendelse an ANN til informationssøgningsopgaver.
Konkluderende kan det fastslås, at anvendelsen af ANN indenfor
informationsvidenskabelige problemstillinger har været spredte og på det
eksperimenterende stade. Hovedproblemet er det samme som med *kunstig
intelligens generelt: informationsvidenskabens problemstillinger opfylde typisk
ikke de krav, der stilles for at etablere ekspertsystemer m.v. Men der kan
dukke specielle opgaver op, hvor ANN i hånden på en kyndig
informationsspecialist kan vise sig værdifulde.