1
00:00:10,000 --> 00:00:15,800
Buenas, esto es BIMPRAXIS, el podcast donde el

2
00:00:15,800 --> 00:00:17,920
BIM se encuentra con la inteligencia artificial.

3
00:00:20,519 --> 00:00:23,620
Exploramos la ciencia, la tecnología y el futuro

4
00:00:23,620 --> 00:00:26,559
desde el enfoque de la arquitectura, ingeniería y

5
00:00:26,559 --> 00:00:27,179
construcción.

6
00:00:28,859 --> 00:00:29,519
¡Empezamos!

7
00:00:37,240 --> 00:00:38,439
Muy buenas.

8
00:00:38,439 --> 00:00:42,219
Bienvenidas, bienvenidos a un nuevo episodio de BIMPRAXIS.

9
00:00:42,219 --> 00:00:44,299
Hoy os traemos el fascinante mundo de los

10
00:00:44,299 --> 00:00:47,719
microchips de inteligencia artificial y la estrategia radical

11
00:00:47,719 --> 00:00:50,340
de Grok para desafiar el dominio absoluto de

12
00:00:50,340 --> 00:00:50,799
NVIDIA.

13
00:00:51,299 --> 00:00:54,820
Bueno, y para empezar fuerte, pongámonos en situación.

14
00:00:54,820 --> 00:00:57,880
Imagínate que tienes 10 millones de dólares sobre

15
00:00:57,880 --> 00:01:00,140
la mesa, listos para entrar en tu cuenta

16
00:01:00,140 --> 00:01:01,280
bancaria.

17
00:01:01,280 --> 00:01:03,859
Y la única condición es no irte de

18
00:01:03,859 --> 00:01:07,560
tu empresa, quedarte exactamente donde estás y vas

19
00:01:07,560 --> 00:01:08,819
y dices que no.

20
00:01:08,819 --> 00:01:10,299
Madre mía, 10 millones.

21
00:01:10,299 --> 00:01:12,359
O sea, rechazar eso para fundar una startup

22
00:01:12,359 --> 00:01:13,819
desde cero absoluto.

23
00:01:13,819 --> 00:01:15,920
A ver, hay que tener una convicción casi

24
00:01:15,920 --> 00:01:17,879
temeraria para dar un paso así.

25
00:01:17,879 --> 00:01:18,540
Totalmente.

26
00:01:18,540 --> 00:01:20,599
Y de esa certeza es de lo que

27
00:01:20,599 --> 00:01:22,799
venimos a hablar en este análisis a fondo.

28
00:01:22,799 --> 00:01:26,319
Hemos estado revisando dos entrevistas recientes y larguísimas

29
00:01:26,319 --> 00:01:27,799
con Jonathan Ross, que es el CEO de

30
00:01:27,799 --> 00:01:30,079
Grok, para intentar entender todo esto.

31
00:01:30,079 --> 00:01:33,579
Toda la industria tecnológica parece estar enfocando mal

32
00:01:33,579 --> 00:01:35,980
uno de los problemas más gordos de nuestra

33
00:01:35,980 --> 00:01:36,480
era.

34
00:01:36,480 --> 00:01:38,879
¿Y cómo poner el software primero puede cambiar

35
00:01:38,879 --> 00:01:41,900
no sólo la economía, sino la geopolítica mundial?

36
00:01:41,900 --> 00:01:43,920
Sí, sí, pero es que hay que contextualizar

37
00:01:43,920 --> 00:01:45,060
quién es este hombre.

38
00:01:45,060 --> 00:01:47,000
No es un ingeniero cualquiera.

39
00:01:47,000 --> 00:01:49,260
Cuando estaba en Google, fue el creador del

40
00:01:49,260 --> 00:01:52,719
TPU, la famosa unidad de procesamiento tensorial.

41
00:01:52,719 --> 00:01:55,680
Claro, el chip de inteligencia artificial de Google.

42
00:01:55,680 --> 00:01:56,859
Ese mismo.

43
00:01:56,859 --> 00:01:59,400
Y fíjate que lo hizo dedicando el 20%

44
00:01:59,400 --> 00:02:02,019
de su tiempo libre en esos proyectos paralelos

45
00:02:02,019 --> 00:02:03,840
que dejaba hacer la empresa.

46
00:02:03,840 --> 00:02:05,319
O sea, mientras todo el mundo se pedea

47
00:02:05,019 --> 00:02:07,459
hoy por las tarjetas gráficas de siempre, las

48
00:02:07,459 --> 00:02:10,719
GPUs, Grok está jugando a otra cosa.

49
00:02:10,719 --> 00:02:13,199
A un ajedrez totalmente distinto, sí.

50
00:02:13,199 --> 00:02:14,960
Y para entender de dónde sale el germen

51
00:02:14,960 --> 00:02:17,280
de esta idea, hay una anécdota de 2012

52
00:02:17,280 --> 00:02:19,379
en el comedor de Google que me parece,

53
00:02:19,379 --> 00:02:20,199
vamos, buenísima.

54
00:02:20,199 --> 00:02:21,919
Ya sé por dónde vas la historia del

55
00:02:21,960 --> 00:02:22,939
modelo de voz.

56
00:02:22,939 --> 00:02:24,039
Esa es.

57
00:02:24,039 --> 00:02:26,500
Resulta que unos investigadores acaban de conseguir que

58
00:02:26,500 --> 00:02:28,780
una IA reconozca la voz humana mejor que

59
00:02:28,780 --> 00:02:29,919
una persona.

60
00:02:29,919 --> 00:02:31,379
Un hito brutal.

61
00:02:31,379 --> 00:02:32,639
Pero estaban amargados.

62
00:02:32,639 --> 00:02:35,180
Claro, porque tenían el modelo entrenado, pero ponerlo

63
00:02:35,180 --> 00:02:36,960
a funcionar en la vida real para millones

64
00:02:36,960 --> 00:02:39,680
de usuarios era económicamente imposible.

65
00:02:39,680 --> 00:02:42,240
Costaba una barbaridad en potencia de cálculo.

66
00:02:42,240 --> 00:02:43,780
Y ahí entra Ross y crea el TPU

67
00:02:43,780 --> 00:02:46,020
para solucionar ese cuello de botella.

68
00:02:46,020 --> 00:02:47,199
Pero lo fuerte es cuando se va de

69
00:02:47,199 --> 00:02:47,819
Google.

70
00:02:47,819 --> 00:02:49,419
Porque se da cuenta de que si monta

71
00:02:49,419 --> 00:02:51,699
una empresa nueva y hace un chip copiando

72
00:02:51,699 --> 00:02:54,780
el enfoque tradicional, centrándose solo en la fuerza

73
00:02:54,780 --> 00:02:56,659
bruta del hardware, se la va a pegar.

74
00:02:56,659 --> 00:02:59,080
Se la pega seguro, por culpa del software.

75
00:02:59,180 --> 00:03:00,939
O sea, para que te hagas una idea,

76
00:03:00,939 --> 00:03:04,300
en empresas dominantes como NVIDIA puede haber 10.000

77
00:03:04,300 --> 00:03:08,020
personas, 10.000, dedicadas solo a escribir kernels.

78
00:03:08,020 --> 00:03:11,020
Espera, aclaremos esto un segundo.

79
00:03:11,020 --> 00:03:13,879
Escribir kernels es básicamente programar a un nivel

80
00:03:13,879 --> 00:03:15,199
bajísimo, ¿no?

81
00:03:15,199 --> 00:03:17,520
Muy, muy cerca de la máquina física.

82
00:03:17,520 --> 00:03:20,080
Exacto, código ensamblador puro y duro.

83
00:03:20,080 --> 00:03:23,560
Es un trabajo hiperartesanal donde ajustas las matemáticas

84
00:03:23,560 --> 00:03:25,919
a la forma física del silicio.

85
00:03:25,919 --> 00:03:28,919
Y claro, ninguna startup puede contratar a 10.000

86
00:03:28,580 --> 00:03:31,000
personas de golpe para igualar eso.

87
00:03:31,000 --> 00:03:33,300
Ya, es imposible competir así de la noche

88
00:03:33,300 --> 00:03:34,219
a la mañana.

89
00:03:34,620 --> 00:03:36,860
Entonces Grok hace lo que la industria consideró

90
00:03:36,860 --> 00:03:38,300
una herejía.

91
00:03:38,300 --> 00:03:40,860
Se tiran los primeros seis meses construyendo un

92
00:03:40,860 --> 00:03:44,360
compilador, o sea, software, antes de diseñar siquiera

93
00:03:44,360 --> 00:03:46,039
la arquitectura del chip.

94
00:03:45,800 --> 00:03:47,900
Es que suena a ciencia ficción.

95
00:03:48,039 --> 00:03:50,500
Hicieron un modelo matemático perfecto de cómo debería

96
00:03:50,500 --> 00:03:52,860
ser el hardware ideal para la IA, crearon

97
00:03:52,860 --> 00:03:55,039
el software para ese modelo y luego ya

98
00:03:55,039 --> 00:03:57,280
fabricaron el chip físico para que encajara como

99
00:03:57,280 --> 00:03:58,199
un guante.

100
00:03:58,000 --> 00:04:00,479
O sea, lo diseñaron para ser nativo en

101
00:04:00,479 --> 00:04:03,879
la nube, en entornos serverless, que básicamente significa

102
00:04:03,879 --> 00:04:06,280
que el desarrollador manda el código y no

103
00:04:06,280 --> 00:04:08,719
tiene que pelearse con servidores ni gestionar la

104
00:04:08,719 --> 00:04:09,560
memoria.

105
00:04:09,599 --> 00:04:10,780
Funciona solo, sí.

106
00:04:10,780 --> 00:04:13,280
La plataforma lo ejecuta de forma invisible.

107
00:04:13,280 --> 00:04:15,520
Pues, a ver, haciendo una analogía.

108
00:04:15,599 --> 00:04:17,079
Esto es como si te venden un coche

109
00:04:17,079 --> 00:04:19,720
de Fórmula 1 hiper rápido, pero te dicen,

110
00:04:19,720 --> 00:04:21,928
oye, construyete tú el circuito y ponle el

111
00:04:21,928 --> 00:04:23,488
motor de arranque pieza por pieza.

112
00:04:23,868 --> 00:04:25,528
Y Grok hace lo contrario.

113
00:04:25,528 --> 00:04:27,688
Construye primero la pista y la telemetría.

114
00:04:27,688 --> 00:04:29,708
Y luego hace un coche a medida para

115
00:04:29,708 --> 00:04:30,848
que ruede solo.

116
00:04:30,988 --> 00:04:32,208
Me encanta el ejemplo.

117
00:04:32,208 --> 00:04:33,008
Es tal cual.

118
00:04:33,028 --> 00:04:35,328
Pero esto me genera una duda razonable.

119
00:04:35,328 --> 00:04:37,008
Si el software es el verdadero dolor de

120
00:04:37,008 --> 00:04:39,388
cabeza, y hasta gigantes como Meta o Google

121
00:04:39,388 --> 00:04:42,008
sufren con ello, ¿por qué absolutamente todas las

122
00:04:42,008 --> 00:04:44,528
startups siguen cometiendo el error de empezar por

123
00:04:44,528 --> 00:04:45,248
el silicio?

124
00:04:45,328 --> 00:04:47,828
Por pura inercia cultural, la verdad.

125
00:04:47,968 --> 00:04:50,308
A los ingenieros de hardware les apasiona el

126
00:04:50,308 --> 00:04:53,328
hardware, les fascina buscar el nanosegundo de ventaja

127
00:04:53,328 --> 00:04:54,288
física.

128
00:04:54,548 --> 00:04:56,188
Pero Ross lo explica muy bien con un

129
00:04:56,188 --> 00:04:58,648
escenario demoledor en las entrevistas.

130
00:04:58,648 --> 00:05:00,188
¿Qué escenario plantea?

131
00:05:00,348 --> 00:05:03,268
Pues imagina que haces el chip del futuro,

132
00:05:03,268 --> 00:05:04,928
el más rápido de la historia.

133
00:05:04,928 --> 00:05:06,048
Una maravilla.

134
00:05:05,568 --> 00:05:07,848
pero si a los clientes les quitas una

135
00:05:07,848 --> 00:05:09,808
sola función de software que ya usan hoy

136
00:05:09,808 --> 00:05:12,908
en día, como el Speculative Decode o el

137
00:05:12,908 --> 00:05:15,328
Prefix Caching, no te lo compra nadie.

138
00:05:15,388 --> 00:05:17,008
Cero ventas, claro.

139
00:05:17,008 --> 00:05:19,148
Nadie lo querría en sus centros de datos.

140
00:05:19,228 --> 00:05:22,088
Oye, desgranemos un poco esos conceptos porque la

141
00:05:22,088 --> 00:05:24,448
jerga técnica a veces asusta, y esto es

142
00:05:24,448 --> 00:05:24,748
clave.

143
00:05:25,268 --> 00:05:27,368
¿Qué es exactamente el Speculative Decode?

144
00:05:28,108 --> 00:05:30,728
Es pura magia matemática, te lo prometo.

145
00:05:30,948 --> 00:05:33,508
Básicamente la IA redacta en borrador varias palabras

146
00:05:33,508 --> 00:05:37,048
futuras, las adivina, mientras todavía está procesando la

147
00:05:37,048 --> 00:05:37,808
actual.

148
00:05:37,908 --> 00:05:39,748
Si acierta, aprueba todo el bloca de golpe

149
00:05:39,748 --> 00:05:41,828
y se ahorra muchísimo tiempo.

150
00:05:41,748 --> 00:05:42,828
Ostras, qué bueno.

151
00:05:42,828 --> 00:05:45,668
Es como ir rellenando el texto por adelantado.

152
00:05:45,608 --> 00:05:47,948
¿Y el prefix caching qué hace?

153
00:05:48,068 --> 00:05:50,508
Eso es guardar en memoria trozos de conversación

154
00:05:50,508 --> 00:05:52,768
que se repiten mucho para que el modelo

155
00:05:52,768 --> 00:05:54,248
no tenga que volver a leer todo el

156
00:05:54,248 --> 00:05:55,988
historial cada vez que le haces una pregunta

157
00:05:55,988 --> 00:05:56,308
nueva.

158
00:05:57,168 --> 00:05:58,928
Son trucos 100% de software.

159
00:05:58,108 --> 00:06:00,888
Si tu chip nuevo no soporta esto, su

160
00:06:00,888 --> 00:06:02,708
rendimiento real se hunde.

161
00:06:02,468 --> 00:06:03,708
Clarísimo.

162
00:06:03,708 --> 00:06:05,648
O sea, el silicio sin software no es

163
00:06:05,648 --> 00:06:06,368
nada.

164
00:06:06,708 --> 00:06:09,708
Y bueno, una vez solucionado este problema inmenso,

165
00:06:09,648 --> 00:06:11,368
llegamos a la máquina en sí, el chip

166
00:06:11,368 --> 00:06:13,928
LPU de Grok, la unidad de procesamiento de

167
00:06:13,928 --> 00:06:14,308
lenguaje.

168
00:06:15,048 --> 00:06:17,028
Aquí es donde empieza la verdadera guerra técnica

169
00:06:17,028 --> 00:06:18,888
contra las famosas GPU.

170
00:06:19,008 --> 00:06:20,788
Contra las tarjetas gráficas, exacto.

171
00:06:21,208 --> 00:06:23,328
Y la diferencia por la que una arquitectura

172
00:06:23,328 --> 00:06:25,748
es superior a otra está en las matemáticas

173
00:06:25,748 --> 00:06:27,748
de la inferencia, que es la fase de

174
00:06:27,748 --> 00:06:29,488
responder a los usuarios.

175
00:06:29,228 --> 00:06:32,028
Porque entrenar una IA es un problema distinto,

176
00:06:32,028 --> 00:06:32,728
¿verdad?

177
00:06:32,728 --> 00:06:34,208
Es un problema paralelo.

178
00:06:34,208 --> 00:06:35,048
Eso es.

179
00:06:35,048 --> 00:06:37,948
Al entrenar, coges trillones de datos y pones

180
00:06:37,948 --> 00:06:40,128
a miles de chips a devorarlos a la

181
00:06:40,128 --> 00:06:42,148
vez, cada uno por su lado.

182
00:06:42,208 --> 00:06:45,068
Para eso, las GPUs, que nacieron para calcular

183
00:06:45,068 --> 00:06:47,128
millones de píxeles en la pantalla de un

184
00:06:47,128 --> 00:06:50,108
videojuego al mismo tiempo, son perfectas.

185
00:06:50,028 --> 00:06:52,788
Pero la inferencia, cuando el modelo genera texto

186
00:06:52,788 --> 00:06:55,368
palabra por palabra, es secuencial.

187
00:06:55,468 --> 00:06:58,128
O sea, matemáticamente no puedes adivinar el token

188
00:06:58,128 --> 00:07:00,308
100 de una frase sin haber calculado primero

189
00:07:00,308 --> 00:07:01,328
el 99.

190
00:07:01,468 --> 00:07:02,228
Imposible.

191
00:07:02,228 --> 00:07:03,368
Tiene que ir en orden.

192
00:07:03,388 --> 00:07:04,828
Hay un ejemplo en las fuentes que ilustra

193
00:07:04,828 --> 00:07:06,168
esto a la perfección.

194
00:07:06,248 --> 00:07:08,788
Imagina que encargas un informe súper importante.

195
00:07:08,748 --> 00:07:10,548
Si pones a 10 personas a escribirlo a

196
00:07:10,548 --> 00:07:13,648
la vez en habitaciones separadas y sin comunicarse.

197
00:07:13,448 --> 00:07:16,148
Sale un Frankenstein, un desastre sin sentido.

198
00:07:16,028 --> 00:07:16,868
Tal cual.

199
00:07:16,868 --> 00:07:20,028
Eso representaría intentar usar una GPU para inferencia.

200
00:07:20,008 --> 00:07:21,508
En cambio, si coges a una sola persona

201
00:07:21,508 --> 00:07:24,428
brillante y la pones a escribir, revisar y

202
00:07:24,428 --> 00:07:27,488
reescribir 10 veces en secuencia lógica, te sale

203
00:07:27,488 --> 00:07:28,928
un informe impecable.

204
00:07:28,828 --> 00:07:31,648
Y a una velocidad vertiginosa.

205
00:07:31,648 --> 00:07:34,228
Esa es la esencia del LPU de Grok.

206
00:07:34,788 --> 00:07:37,568
Y fíjate, para conseguir que el hardware ejecute

207
00:07:37,568 --> 00:07:42,028
esa secuencia tan rápido, tomaron otra decisión drástica.

208
00:07:42,248 --> 00:07:45,208
Quitaron por completo la memoria externa.

209
00:07:44,968 --> 00:07:48,188
Adiós a la memoria externa, la famosa HBM.

210
00:07:47,708 --> 00:07:49,288
Pero a ver, ¿por qué?

211
00:07:49,288 --> 00:07:51,228
Si todas las tarjetas gráficas la usan.

212
00:07:51,308 --> 00:07:54,228
Sí, pero es un problema puramente físico.

213
00:07:54,228 --> 00:07:57,488
Los cables finísimos que conectan el procesador con

214
00:07:57,488 --> 00:08:00,968
esa memoria externa funcionan en realidad como pequeños

215
00:08:00,968 --> 00:08:03,368
condensadores eléctricos.

216
00:08:02,948 --> 00:08:05,868
Uy, espera, detengámonos en la física de esto.

217
00:08:05,868 --> 00:08:08,128
¿Qué significa a nivel práctico que actúen como

218
00:08:08,128 --> 00:08:09,328
condensadores?

219
00:08:09,248 --> 00:08:11,108
Pues que cada vez que quieres mandar un

220
00:08:11,108 --> 00:08:13,728
1 o un 0 por ese cable, primero

221
00:08:13,728 --> 00:08:15,948
tienes que llenarlo de electrones.

222
00:08:15,788 --> 00:08:17,828
Tienes que cargarlo de electricidad para que la

223
00:08:17,828 --> 00:08:20,968
señal llegue al otro lado y luego descargarlo.

224
00:08:20,688 --> 00:08:22,748
Ah, o sea que cuanta más distancia hay

225
00:08:22,748 --> 00:08:26,048
hasta la memoria externa, más energía desperdicias sólo

226
00:08:26,048 --> 00:08:27,988
en cargar y descargar cables.

227
00:08:27,928 --> 00:08:28,928
Exacto.

228
00:08:28,928 --> 00:08:31,248
Gastas mucho más energía moviendo el dato de

229
00:08:31,248 --> 00:08:32,948
un lado a otro que haciendo la operación

230
00:08:32,948 --> 00:08:34,348
matemática en sí.

231
00:08:34,448 --> 00:08:37,268
Por eso Grohe usa sólo memoria interna, la

232
00:08:37,268 --> 00:08:38,228
SRAM.

233
00:08:38,228 --> 00:08:40,536
El dato vive exactamente donde se hace el

234
00:08:40,536 --> 00:08:41,516
cálculo.

235
00:08:41,496 --> 00:08:43,896
O sea, viaja milímetros en vez de centímetros.

236
00:08:44,796 --> 00:08:46,736
Y el impacto de rediseñar esto a gran

237
00:08:46,736 --> 00:08:48,136
escala es asombroso.

238
00:08:49,016 --> 00:08:50,976
En los fuentes explican que para correr un

239
00:08:50,976 --> 00:08:53,896
modelo masivo como llama Maverick, no dividen el

240
00:08:53,896 --> 00:08:55,836
trabajo a ver qué chip está libre.

241
00:08:55,676 --> 00:08:56,036
No, no.

242
00:08:56,036 --> 00:09:00,116
Conectan más de 3.000 microchips directamente entre sí.

243
00:09:00,156 --> 00:09:03,116
Sin switches de red intermedio, sin nada.

244
00:09:02,876 --> 00:09:04,436
Es como una línea de montaje en una

245
00:09:04,436 --> 00:09:05,556
fábrica, ¿no?

246
00:09:05,556 --> 00:09:07,576
El token viaja por el silicio de los

247
00:09:07,576 --> 00:09:11,736
3.000 procesadores casi al instante, perfectamente coreografiado.

248
00:09:11,916 --> 00:09:13,836
Y el efecto dominó que provoca no usar

249
00:09:13,836 --> 00:09:16,696
memoria externa te cambia todo el sistema.

250
00:09:16,696 --> 00:09:20,116
Al no desperdiciar electricidad moviendo datos, el consumo

251
00:09:20,116 --> 00:09:21,356
se desploma.

252
00:09:21,356 --> 00:09:23,336
Hablamos de gastar una tercera parte de la

253
00:09:23,336 --> 00:09:24,976
energía por cada palabra.

254
00:09:24,736 --> 00:09:27,576
Y esto, fíjate, soluciona el que seguramente sea

255
00:09:27,576 --> 00:09:29,296
el mayor cuello de botilla de la IA

256
00:09:29,296 --> 00:09:30,516
hoy en día.

257
00:09:30,516 --> 00:09:31,716
El problema térmico.

258
00:09:31,716 --> 00:09:32,936
La refrigeración.

259
00:09:33,036 --> 00:09:35,436
Claro, porque montar un centro de datos basado

260
00:09:35,436 --> 00:09:38,456
en tarjetas gráficas ahora mismo es una pesadilla,

261
00:09:38,456 --> 00:09:39,916
que tarda años.

262
00:09:39,916 --> 00:09:44,016
Necesitas permisos eléctricos bestiales y sistemas de refrigeración

263
00:09:44,016 --> 00:09:48,356
líquida complejísimos porque los chips son auténticos hornos.

264
00:09:47,896 --> 00:09:50,576
literalmente hornos industriales.

265
00:09:50,736 --> 00:09:52,916
Sin embargo, Grok levantó un centro de datos

266
00:09:52,916 --> 00:09:55,856
operativo en Finlandia en 34 días y otro

267
00:09:55,856 --> 00:09:57,636
en Arabia Saudí en 51 días.

268
00:09:58,296 --> 00:10:00,116
Es un ritmo de otro planeta.

269
00:10:00,256 --> 00:10:02,756
Lo consiguen porque están aprovechando lo que la

270
00:10:02,756 --> 00:10:04,336
industria desecha.

271
00:10:04,636 --> 00:10:07,916
Como no necesitan esa refrigeración líquida tan extrema,

272
00:10:07,916 --> 00:10:09,236
funcionan con aire.

273
00:10:09,316 --> 00:10:12,296
Así que alquilan los espacios enormes refrigerados por

274
00:10:12,296 --> 00:10:14,436
aire que los gigantes de la nube están

275
00:10:14,436 --> 00:10:16,216
abandonando por obsoletos.

276
00:10:15,956 --> 00:10:18,456
Los enchufan y en semanas están operando.

277
00:10:18,456 --> 00:10:19,056
¡Qué pasada!

278
00:10:19,056 --> 00:10:22,096
Y esto nos empuja directamente a un concepto

279
00:10:22,096 --> 00:10:25,216
geopolítico muy fuerte, la IA soberana.

280
00:10:25,936 --> 00:10:28,396
Un concepto que está cambiando las políticas de

281
00:10:28,396 --> 00:10:29,156
Estado.

282
00:10:29,156 --> 00:10:32,256
Países enteros como Canadá o Arabia Saudí se

283
00:10:32,256 --> 00:10:34,116
han dado cuenta de que la capacidad de

284
00:10:34,116 --> 00:10:37,236
computación es ahora mismo como las plantas de

285
00:10:37,236 --> 00:10:39,336
energía en la revolución industrial.

286
00:10:38,856 --> 00:10:39,976
Claro.

287
00:10:39,976 --> 00:10:42,296
Si estás en plena revolución, depender de un

288
00:10:42,296 --> 00:10:44,556
país vecino para que te dé la electricidad

289
00:10:44,556 --> 00:10:46,616
que mueve tus fábricas es un suicidio.

290
00:10:46,736 --> 00:10:48,216
Exactamente.

291
00:10:48,216 --> 00:10:50,076
Estas naciones ven que la IA va a

292
00:10:50,076 --> 00:10:52,436
ser el motor económico y se niegan a

293
00:10:52,436 --> 00:10:55,096
depender de que cuatro corporaciones de Estados Unidos

294
00:10:55,096 --> 00:10:58,236
decidan cuándo les toca comprar GPUs en una

295
00:10:58,236 --> 00:10:59,896
lista de espera de años.

296
00:10:59,656 --> 00:11:03,256
Quieren su infraestructura ya, bajo su propia jurisdicción.

297
00:11:03,256 --> 00:11:05,116
Y con la tecnología de Grok, que gasta

298
00:11:05,116 --> 00:11:07,456
poca energía y se enfría por aire, les

299
00:11:07,456 --> 00:11:08,756
cuadra perfecto.

300
00:11:08,756 --> 00:11:11,296
Pero a ver, planteado así suena impecable, te

301
00:11:11,296 --> 00:11:12,056
lo compro.

302
00:11:12,216 --> 00:11:13,236
Ya viene el pero.

303
00:11:13,136 --> 00:11:15,596
Sí, tengo que hacer de abogado del diablo

304
00:11:15,596 --> 00:11:17,336
con el tema financiero.

305
00:11:17,336 --> 00:11:19,616
En las fuentes, Ross dice que quiere acaparar

306
00:11:19,616 --> 00:11:22,596
el 50% de la inferencia mundial tirando los

307
00:11:22,596 --> 00:11:24,136
precios casi a cero.

308
00:11:24,136 --> 00:11:26,396
Actuar como el Costco o el Amazon mayorista

309
00:11:26,396 --> 00:11:27,376
de los chips.

310
00:11:27,256 --> 00:11:29,936
Volumen muy alto, margen muy bajo, sí Pero

311
00:11:29,936 --> 00:11:32,196
frente a los márgenes del 80% que tiene

312
00:11:32,196 --> 00:11:34,576
Nvidia ¿Cómo convences tú a los inversores de

313
00:11:34,576 --> 00:11:37,176
Silicon Valley De que ganar menos dinero por

314
00:11:37,176 --> 00:11:38,576
operación es una victoria?

315
00:11:38,496 --> 00:11:41,176
Es una pregunta buenísima La clave es entender

316
00:11:41,176 --> 00:11:44,436
que entrenaría y usaría Son mercados con economías

317
00:11:44,436 --> 00:11:48,696
opuestas El entrenamiento es pura investigación y desarrollo

318
00:11:49,236 --> 00:11:52,016
Ahí paras márgenes del 80% Por tener el

319
00:11:52,016 --> 00:11:54,416
modelo más inteligente del mundo Cueste lo que

320
00:11:54,416 --> 00:11:56,836
cueste Vale, pero la inferencia es el día

321
00:11:56,836 --> 00:11:57,576
a día.

322
00:11:57,576 --> 00:11:59,276
Es cada vez que el usuario usa la

323
00:11:59,276 --> 00:12:00,796
aplicación en el móvil.

324
00:12:00,796 --> 00:12:03,596
Y para que ese volumen gigante de operaciones

325
00:12:03,596 --> 00:12:06,176
sea viable, el coste tiene que tender a

326
00:12:06,176 --> 00:12:06,836
cero.

327
00:12:07,236 --> 00:12:09,476
Y aquí viene lo fascinante del argumento de

328
00:12:09,476 --> 00:12:10,016
Ross.

329
00:12:10,136 --> 00:12:13,916
Él dice que Grok es, irónicamente, lo mejor

330
00:12:13,916 --> 00:12:15,976
que les ha pasado a los accionistas de

331
00:12:15,976 --> 00:12:16,176
Nvidia.

332
00:12:16,956 --> 00:12:19,676
Eso sí que me parece contraintuitivo total.

333
00:12:19,676 --> 00:12:21,316
¿Cómo vas a ser aliado si quieres hundir

334
00:12:21,316 --> 00:12:21,756
los precios?

335
00:12:22,876 --> 00:12:26,016
Por pura lógica financiera, si Grok absorbe el

336
00:12:26,016 --> 00:12:29,156
mercado de inferencia barata, Nvidia no tiene que

337
00:12:29,156 --> 00:12:31,016
meterse en esa guerra de precios.

338
00:12:31,016 --> 00:12:31,796
Queda protegida.

339
00:12:31,836 --> 00:12:33,276
Ah, ya lo veo.

340
00:12:33,276 --> 00:12:35,996
No tienen que devaluar sus productos estrella.

341
00:12:36,056 --> 00:12:38,656
Pueden seguir vendiendo sus tarjetas al 80% de

342
00:12:38,656 --> 00:12:41,116
margen destinadas solo a entrenamiento.

343
00:12:40,896 --> 00:12:41,656
Eso es.

344
00:12:41,656 --> 00:12:44,316
El mercado se bifurca, uno domina la investigación

345
00:12:44,316 --> 00:12:47,316
cara y el otro monopoliza la ejecución masiva

346
00:12:47,316 --> 00:12:48,036
y barata.

347
00:12:47,976 --> 00:12:51,356
Vale, he entendido el modelo, pero vamos, sobrevivir

348
00:12:51,356 --> 00:12:55,136
a escalar esto a semejante velocidad pasa factura.

349
00:12:55,136 --> 00:12:57,276
Sabemos que la plataforma pasó de procesar casi

350
00:12:57,276 --> 00:12:59,724
nada a servir 20 millones de tokens por

351
00:12:59,724 --> 00:13:02,024
segundo en apenas 18 meses.

352
00:13:02,084 --> 00:13:04,044
Y eso casi destruye la empresa.

353
00:13:04,624 --> 00:13:07,804
Literalmente estuvieron a tres semanas de declarar la

354
00:13:07,804 --> 00:13:08,804
bancarrota.

355
00:13:08,764 --> 00:13:10,364
Madre mía, a tres semanas.

356
00:13:10,444 --> 00:13:12,284
Y aquí es donde la cultura interna demostró

357
00:13:12,284 --> 00:13:13,164
su valor.

358
00:13:13,084 --> 00:13:15,444
Porque en tecnología, cuando pasa esto, lo habitual

359
00:13:15,444 --> 00:13:17,164
es hacer despidos masivos.

360
00:13:17,284 --> 00:13:19,124
Pero si hacían eso, se quedaban sin los

361
00:13:19,124 --> 00:13:22,004
ingenieros que necesitaban para solucionar el problema.

362
00:13:22,244 --> 00:13:24,284
Así que miraron a la historia, mi Litter.

363
00:13:24,404 --> 00:13:26,424
a los bonos de la Segunda Guerra Mundial

364
00:13:26,424 --> 00:13:29,504
y crearon los bonos GROC.

365
00:13:29,604 --> 00:13:32,304
Propusieron a la plantilla recortes de sueldo voluntarios

366
00:13:32,304 --> 00:13:33,144
a cambio de acciones.

367
00:13:33,484 --> 00:13:36,224
El 80% de la plantilla aceptó el trato.

368
00:13:36,224 --> 00:13:37,084
Es brutal.

369
00:13:37,304 --> 00:13:39,444
Y lo más revelador, la mitad llegó a

370
00:13:39,444 --> 00:13:42,264
bajarse el sueldo hasta el mínimo legal permitido.

371
00:13:42,484 --> 00:13:44,664
Eso no se hace solo por dinero, requiere

372
00:13:44,664 --> 00:13:46,604
una fe ciega en la tecnología.

373
00:13:46,684 --> 00:13:49,544
Y esa experiencia de supervivencia extrema les generó

374
00:13:49,544 --> 00:13:51,764
fobia a lo que ellos llaman la diabetes

375
00:13:51,764 --> 00:13:53,064
financiera.

376
00:13:53,024 --> 00:13:54,744
La diabetes financiera.

377
00:13:54,744 --> 00:13:56,764
Qué buen concepto para describir el exceso de

378
00:13:56,764 --> 00:13:58,204
dinero en Silicon Valley.

379
00:13:58,164 --> 00:13:58,904
Sí.

380
00:13:58,904 --> 00:14:02,444
Tener demasiado capital rápido adormece la innovación, porque

381
00:14:02,444 --> 00:14:04,244
tapas los errores con dinero.

382
00:14:04,524 --> 00:14:07,324
La escasez les obligó a ser más creativos.

383
00:14:07,324 --> 00:14:10,084
Por eso también hablan mucho de contratar para

384
00:14:10,084 --> 00:14:11,084
la suerte.

385
00:14:11,084 --> 00:14:13,424
Que, ojo, no es magia ni superstición.

386
00:14:13,424 --> 00:14:15,444
Es construir un equipo que esté predispuesto a

387
00:14:15,444 --> 00:14:17,884
aprovechar oportunidades que otros ignoran.

388
00:14:17,804 --> 00:14:20,144
El mejor ejemplo es cuando pivotaron hacia los

389
00:14:20,144 --> 00:14:23,324
grandes modelos de lenguaje, los LLM.

390
00:14:23,324 --> 00:14:26,264
Al principio, sus propios ingenieros dudaban de meterse

391
00:14:26,264 --> 00:14:26,704
ahí.

392
00:14:26,904 --> 00:14:29,764
Pensarían que no podían competir con los gigantes

393
00:14:29,764 --> 00:14:31,444
establecidos, lógico.

394
00:14:32,304 --> 00:14:34,164
Claro, pero Ross insistió.

395
00:14:34,164 --> 00:14:36,924
Vieron que su hardware secuencial encajaba perfecto con

396
00:14:36,924 --> 00:14:39,764
cómo los modelos generan texto palabra a palabra.

397
00:14:40,104 --> 00:14:43,004
Apostaron, se hicieron virales y capitalizaron algo para

398
00:14:43,004 --> 00:14:44,784
lo que ya estaban preparados.

399
00:14:44,564 --> 00:14:47,004
Ya, pero liderar a este nivel de caos

400
00:14:47,004 --> 00:14:49,624
y velocidad no se hace dando micro órdenes

401
00:14:49,624 --> 00:14:51,024
a los ingenieros.

402
00:14:51,024 --> 00:14:53,024
Y ahí entra el detalle físico de la

403
00:14:53,024 --> 00:14:55,124
moneda de desafío que todos llevan en el

404
00:14:55,124 --> 00:14:55,564
bolsillo.

405
00:14:56,104 --> 00:14:57,964
Una moneda inspirada en el libro Turn the

406
00:14:57,964 --> 00:15:00,924
Ship Around sobre un submarino nuclear estadounidense, ¿sí?

407
00:15:01,064 --> 00:15:03,564
¿Y qué nos dice esa moneda sobre su

408
00:15:03,564 --> 00:15:05,724
estilo de liderazgo intencional?

409
00:15:05,644 --> 00:15:07,584
Pues que en vez de dar órdenes microscópicas

410
00:15:07,584 --> 00:15:10,184
y decirle al equipo cómo hacer su trabajo,

411
00:15:10,184 --> 00:15:12,664
marcaron un objetivo simple y binario grabado en

412
00:15:12,664 --> 00:15:15,464
la moneda, alcanzar los 25 millones de tokens

413
00:15:15,464 --> 00:15:16,184
por segundo.

414
00:15:16,584 --> 00:15:20,184
Fijas el norte magnético, das el contexto y

415
00:15:20,184 --> 00:15:22,644
dejas que los expertos empujen el barco.

416
00:15:22,644 --> 00:15:25,824
Es una lección organizativa brillante, la verdad.

417
00:15:26,804 --> 00:15:29,544
Y bueno, para cerrar este análisis, me gustaría

418
00:15:29,544 --> 00:15:32,144
plantear un pensamiento provocador a la audiencia.

419
00:15:32,804 --> 00:15:33,624
A ver, cuéntanos.

420
00:15:33,924 --> 00:15:36,124
Hay un dato que me dejó pensando.

421
00:15:36,404 --> 00:15:38,124
Ross destacó que de los 2 millones de

422
00:15:38,124 --> 00:15:41,964
desarrolladores que usan su plataforma, 400.000 operan desde

423
00:15:41,964 --> 00:15:44,544
la India, con una ética de trabajo implacable

424
00:15:44,544 --> 00:15:47,004
y sin las comodidades de Silicon Valley.

425
00:15:46,824 --> 00:15:49,304
Es un ejército de talento puro, sí.

426
00:15:49,084 --> 00:15:50,864
Su pregunta me queda en el aire.

427
00:15:51,484 --> 00:15:54,144
Si el coste de pensar y razonar, mediante

428
00:15:54,144 --> 00:15:56,804
IA, tiende a cero gracias a tecnologías como

429
00:15:56,804 --> 00:15:59,344
las de Grok, ¿Estamos a punto de ver

430
00:15:58,844 --> 00:16:02,384
cómo las próximas cinco tecnológicas más grandes del

431
00:16:02,384 --> 00:16:05,744
mundo nacen no en California, sino en regiones

432
00:16:05,284 --> 00:16:08,604
emergentes que sepan exprimir al máximo esta computación

433
00:16:08,604 --> 00:16:09,824
democratizada?

434
00:16:10,444 --> 00:16:13,184
Es para pensarlo, desde luego Antes de despedirnos

435
00:16:13,184 --> 00:16:15,444
hasta el próximo programa, os informamos de que

436
00:16:15,444 --> 00:16:17,624
las voces que oyes han sido generadas por

437
00:16:17,624 --> 00:16:19,924
la IA de Notebook LM y que dirigiendo

438
00:16:19,424 --> 00:16:22,664
el podcast se encuentra Julio Pablo Vázquez, un

439
00:16:22,664 --> 00:16:24,904
humano que te envía saludos En caso de

440
00:16:24,904 --> 00:16:27,464
error, probablemente sean errores humanos.

441
00:16:27,464 --> 00:16:28,104
¡Nos escuchamos!

442
00:16:39,464 --> 00:16:41,684
Y hasta aquí el episodio de hoy.

443
00:16:41,684 --> 00:16:43,284
Muchas gracias por tu atención.

444
00:16:53,144 --> 00:16:56,804
Esto es BIMPRAXIS Nos escuchamos en el próximo

445
00:16:56,804 --> 00:16:57,404
episodio

