Introducció a les xarxes

Índex
- 1.Introducció a les xarxes
- 2.Xarxes pertot arreu
- 2.1.Xarxes tecnològiques
- 2.1.1.Internet
- 2.1.2.Xarxa de telefonia
- 2.1.3.Xarxa de distribució elèctrica (power grid)
- 2.1.4.Xarxes de transport
- 2.2.Xarxes biològiques
- 2.2.1.Xarxes bioquímiques
- 2.2.2.Xarxes neuronals
- 2.2.3.Xarxes ecològiques
- 2.3.Xarxes socials
- 2.4.Xarxes d’informació
- 2.4.1.El World Wide Web
- 2.4.2.Xarxes de cites, patents i legals
- 2.4.3.Coautories
- 2.4.4.Consells d’administració
- 2.4.5.Sistemes de recomanació
- 2.1.Xarxes tecnològiques
- 3.Què és una xarxa?
- 3.1.Nodes i enllaços
- 3.2.Tipus de xarxes
- 3.2.1.Xarxes bipartides
- 3.3.Descripcions
- 4.Caracterització dels nodes d’una xarxa
- 4.1.Grau
- 4.2.Camins (paths)
- 4.3.Longitud
- 4.4.Distància entre nodes
- 4.5.Closeness centrality
- 4.6.Betweenness centrality
- 4.7.Eigenvector centrality
- 4.8.Page rank
- 4.9.Clusteringd’un node
- 5.L’estructura de les xarxes
- 5.1.Grandària d’una xarxa
- 5.2.Clusteringde la xarxa
- 5.3.Components
- 5.4.Motifs
- 5.5.Cliques
- 5.6.Comunitats
- 6.Universalitat
- 7.Modelització de les xarxes
- 7.1.Erdös-Rényi (ER)
- 7.2.Watts-Strogatz (WS)
- 7.3.Barabási-Albert (BA)
- 7.4.Altres models
1.Introducció a les xarxes
1.1.La importància de les xarxes o “Com Kevin Bacon ha ajudat a curar el càncer”
Enllaços recomanats
Entrada a la Viquipèdia sobre l’obra de teatre:
http://en.wikipedia.org/wiki/Six_Degrees_of_Separation_(play)
|
Enllaços recomanats
La versió traduïda al castellà de l’article original es pot trobar en la revista Araucaria
(2003, núm. 10, pàg. 15):
http://www.institucional.us.es/araucaria/nro10/ideas10_2.pdf
|
Enllaços recomanats
Internet Movie DataBase:
http://www.imdb.com/
|
Enllaços recomanats
The Oracle of Bacon:
http://oracleofbacon.org/
|
Enllaços recomanats
El nombre d’Erdös:
http://en.wikipedia.org/wiki/Erdös_number
|

Enllaços recomanats
L’article pioner de Watts i Strogatz: doi:10.1038/30918
|
Vídeo recomanat
Connected - How Kevin Bacon cured cancer.
Produït per l’ABC, cadena australiana.
|
1.2.Un món complex
Vídeo recomanat
Synchronized fireflies
http://youtu.be/a-Vy7NZTGos
|
Vídeo recomanat
TEDtalk, de Steven Strogatz, sobre sincronització (subtitulat en castellà).
http://www.ted.com/talks/steven_strogatz_on_sync.html
|
1.3.Connexions
1.3.1.Un problema d’escacs


2.Xarxes pertot arreu
2.1.Xarxes tecnològiques
2.1.1.Internet

2.1.2.Xarxa de telefonia
2.1.3.Xarxa de distribució elèctrica (power grid)

2.1.4.Xarxes de transport

2.2.Xarxes biològiques
2.2.1.Xarxes bioquímiques
-
Xarxes metabòliques: en aquest cas, la xarxa correspon als components químics que participen en una reacció, i es relaciona cada reacció amb un dels processos que tenen lloc dins la cèl∙lula.
-
Xarxes d’interacció entre proteïnes: aquest cas correspon a un grau de complexitat superior, ja que les proteïnes no sols interaccionen químicament entre elles, sinó que també ho fan físicament, ja que poden modificar la seva estructura de plegament.
-
Xarxes de regulació genètica: finalment, en aquest cas es consideren lesinteraccions entre diferents parts que formen l’estructura de l’ADN, és a dir, els gens. Identificant aquests gens el que es pretén amb aquestes xarxes és entendre com l’activació o inhibició d’algun (o alguns) d’ells afecta les consegüents activació o inhibició d’altres.

2.2.2.Xarxes neuronals

2.2.3.Xarxes ecològiques

2.3.Xarxes socials
Enllaç recomanat
Anàlisi del moviment 15-M o dels indignats fet al BIFI, a partir de piulades geoposicionades.
http://15m.bifi.es/
|
2.4.Xarxes d’informació
2.4.1.El World Wide Web
2.4.2.Xarxes de cites, patents i legals
Enllaç recomanat
Alex Arenas; Albert Díaz-Guilera (2009). “Análisis y minería web. Identificación de
comunidades analizando el uso del correo electrónico”. El Profesional de la Información (núm. 18).
http://www.elprofesionaldelainformacion.com/contenidos/2009/enero/04.html
|

2.4.3.Coautories

2.4.4.Consells d’administració
2.4.5.Sistemes de recomanació
3.Què és una xarxa?
3.1.Nodes i enllaços
-
Nodes: són els elements principals de les xarxes. Són les unitats bàsiques de la nostra representació, són els ordinadors d’Internet, les pàgines del WWW o els llibres que comprem a Amazon.com. Depenent de la disciplina, aquests nodes reben diferents noms, però nosaltres mantindrem el denodeal llarg del document.
-
Enllaços: són les relacions entre els nodes. Hem vist abans que aquests enllaços poden ser reals, sobre els quals flueix alguna magnitud física, o virtuals, i els interpretem com una relació entre dos nodes, com pot ser un enllaç entre dues pàgines al WWW. Normalment, però, mai no considerem que els nodes tenen autoenllaços ni que entre dos nodes hi ha més d’un enllaç.

3.2.Tipus de xarxes

3.2.1.Xarxes bipartides
a articles i els nodes inferiors, a autors. b) Xarxa ordinària corresponent a la imatge superior.

3.3.Descripcions
-
Llista d’enllaços: aquesta és la que utilitzen la majoria de paquets de programari, com ara el que s’utilitzarà majoritàriament al llarg d’aquest curs, el GEPHI. Consisteix a fer una llista de tots els enllaços com a parells ordenats de nodes per a les xarxes no pesades. Si la xarxa és no dirigida no cal posar-hi els dos ordres, però si la xarxa és dirigida aleshores sí que cal especificar l’ordre. Per a una xarxa pesada s’escriu una tercera columna amb el pes de l’enllaç.
Figura 1.15. Llista d’enllaços de les tres xarxes senzilles representades anteriorment. En el primer cas, cal especificar que la xarxa és undirected, ja que qualsevol enllaç es considera en les dues direccions. En el segon, cal dir directed perquè en aquest cas importa la direccionalitat. Finalment, en el tercer cas, hi ha una tercera columna que correspon al pes de cada enllaç.
-
Llista de veïns (edgelist): aquesta representació s’utilitza només per a les no pesades i fem una llista de veïns (siguin dirigits o no) per a cada node. Aquesta manera de considerar les dades és més eficient per a accedir a les posicions de memòria, sempre que s’utilitzin adreces dinàmiques (apuntadors).
Figura 1.16. Llista de veïns per a les xarxes no pesades anteriors
-
Matriu d’adjacència: aquesta representació és molt útil en tractaments matemàtics, perquè expressa en forma de matriu les llistes anteriors i val també per a les xarxes pesades. En aquest cas, entenem un element de la matriu –i, j– com l’existència (i el pes) de l’enllaç entre el node i i el node j.
Figura 1.17. Matrius d’adjacència per a les xarxes anteriors
4.Caracterització dels nodes d’una xarxa
4.1.Grau


4.2.Camins (paths)
GEPHI
Executem totes les funcions estadístiques. Anem a representació i triem que representi
mitjançant colors cadascuna de les magnituds. Com que podem tenir també un format
Taula podem tenir els valors de cada mesura a cada node.
|
4.3.Longitud
4.4.Distància entre nodes
4.5.Closeness centrality
4.6.Betweenness centrality
4.7.Eigenvector centrality
4.8.Page rank

4.9.Clusteringd’un node

5.L’estructura de les xarxes
5.1.Grandària d’una xarxa
-
Distància mitjana: aquesta mesura és simplement la distància mitjana entre tots els parells de distàncies entre nodes. Per al cas de la xarxa que estem considerant aquesta és de 3,29.
-
Diàmetre: aquesta mesura ens planteja l’analogia amb un cercle i, com que el diàmetre d’un cercle correspon a la distància màxima entre dos dels seus punts, en el cas de la xarxa també es defineix com la distància màxima entre dos nodes. La xarxa que hem estudiat té un diàmetre de 6.
GEPHIExecutant l’opció “Network diameter”. -
Radi: aquest correspon a la mesura de la distància entre el node més central i el més exterior, que en el nostre cas particular és de 3.
5.2.Clusteringde la xarxa
-
Clustering mitjana: en aquest cas, es defineix la clusterització simplement com la mitjana dels valors en els nodes individuals.
-
Clustering global: per a distingir-la de l’anterior, es pot definir també l’efecte global directament, sense fer mitjanes. Així, el que miraríem és el nombre total de triangles en la xarxa respecte al nombre total de triangles que hi podria haver, tenint en compte els enllaços existents.
GEPHI
Amb referència a la clusterització, ens calcula els valors individuals i la clusterització
de la xarxa està calculada com la mitjana sobre tots els nodes.
|
5.3.Components
5.4.Motifs

Motifs
Llista de triangles i motif:
1, 2, 3: 5
1, 2, 4: 2
1, 2, 5: 7
1, 3, 5: 12
1, 3, 6: 3
2, 3, 4: 4
2, 3, 5: 3
2, 3, 6: 3
3, 5, 6: 8
|
5.5.Cliques
5.6.Comunitats



GEPHI
Hem d’executar l’estadística modularitat i ens presenta la millor partició. A l’hora
de representar-la, triem modularity class i en diferents colors podem veure les comunitats.
|



6.Universalitat
6.1.Shortest pathsismall worlds

6.2.Distribució de grau


6.3.Lleis de potència i xarxes lliures d’escala

b) xarxa d’actors; c) xarxa de coautors en la comunitat de física de les altes energies; d)xarxa de coautors en neurociència.


7.Modelització de les xarxes
7.1.Erdös-Rényi (ER)



GEPHI
Amb aquest programari podem generar grafs aleatoris d’Erdös-Rényi en qualsevol de
les dues representacions.
|






7.2.Watts-Strogatz (WS)


7.3.Barabási-Albert (BA)

