1
00:00:09,679 --> 00:00:15,660
Buenas, esto es BIMPRAXIS, el podcast donde el

2
00:00:15,660 --> 00:00:17,719
BIM se encuentra con la inteligencia artificial.

3
00:00:20,339 --> 00:00:23,480
Exploramos la ciencia, la tecnología y el futuro

4
00:00:23,480 --> 00:00:26,420
desde el enfoque de la arquitectura, ingeniería y

5
00:00:26,420 --> 00:00:27,120
construcción.

6
00:00:28,800 --> 00:00:29,440
¡Empezamos!

7
00:00:36,869 --> 00:00:40,170
Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

8
00:00:40,170 --> 00:00:41,170
de BIMPRAXIS.

9
00:00:41,350 --> 00:00:44,250
Hoy os traemos la revolución del código abierto

10
00:00:44,250 --> 00:00:46,869
para crear tu propio asistente de inteligencia artificial.

11
00:00:46,869 --> 00:00:48,229
¡Sin volverte loco!

12
00:00:48,450 --> 00:00:48,929
¡Ragflow!

13
00:00:49,329 --> 00:00:51,710
Eso es, un análisis a fondo que, la

14
00:00:51,710 --> 00:00:53,789
verdad, hace muchísima falta hoy en día.

15
00:00:54,189 --> 00:00:54,670
Totalmente.

16
00:00:54,770 --> 00:00:57,590
Porque, a ver, resulta muy familiar esa sensación

17
00:00:57,590 --> 00:01:00,409
de frustración generalizada con las IAS genéricas, ¿verdad?

18
00:01:00,649 --> 00:01:02,210
Uf, hombre, claro que sí.

19
00:01:02,310 --> 00:01:05,549
Esa situación recurrente en la oficina donde, no

20
00:01:05,549 --> 00:01:06,989
sé, alguien le pide a una de estas

21
00:01:06,989 --> 00:01:11,250
inteligencias artificiales famosísimas que redacte un informe estratégico.

22
00:01:11,370 --> 00:01:14,409
Sí, o que resuelva una duda hiperespecífica sobre

23
00:01:14,409 --> 00:01:15,310
un proyecto interno.

24
00:01:15,730 --> 00:01:16,209
¡Exacto!

25
00:01:16,209 --> 00:01:18,489
Y la respuesta es, bueno, en fin, una

26
00:01:18,489 --> 00:01:20,849
colección de generalidades absolutas.

27
00:01:20,950 --> 00:01:22,709
Una parrafada que no dice nada, vaya.

28
00:01:22,909 --> 00:01:23,269
Tal cual.

29
00:01:23,430 --> 00:01:25,689
O sea, suenan estupendamente bien.

30
00:01:26,150 --> 00:01:30,989
Están redactadas con una prosa envidiable, pero no

31
00:01:30,989 --> 00:01:34,189
aportan absolutamente nada de valor real al problema

32
00:01:34,189 --> 00:01:34,829
de esa empresa.

33
00:01:35,049 --> 00:01:35,870
Cero valor, claro.

34
00:01:36,030 --> 00:01:37,989
Pero, a ver, si se analiza con frialdad,

35
00:01:38,069 --> 00:01:39,489
tiene toda la lógica del mundo.

36
00:01:39,709 --> 00:01:41,269
Ya, no es culpa del modelo en sí.

37
00:01:41,569 --> 00:01:42,510
Exacto, no lo es.

38
00:01:42,650 --> 00:01:44,650
Al fin y al cabo, esa IA genérica,

39
00:01:44,709 --> 00:01:46,489
por muy potente que sea, no tiene acceso

40
00:01:46,489 --> 00:01:48,650
a los documentos internos de la organización.

41
00:01:48,810 --> 00:01:50,409
Claro, ¿no se ha leído los manuales?

42
00:01:50,469 --> 00:01:50,829
Eso es.

43
00:01:50,890 --> 00:01:53,150
No conoce las intrincadas políticas de la empresa,

44
00:01:53,370 --> 00:01:55,730
ni los historiales de incidentes de los clientes.

45
00:01:55,849 --> 00:01:57,709
Hay que matizar que esa IA genérica es

46
00:01:57,709 --> 00:01:58,829
brillante en su campo, ¿eh?

47
00:01:58,950 --> 00:02:00,609
Sí, sí, te escribe un poema en cinco

48
00:02:00,609 --> 00:02:00,989
segundos.

49
00:02:01,290 --> 00:02:03,189
Hombre, sabe cómo escribir un soneto al estilo

50
00:02:03,189 --> 00:02:04,269
de Cervantes, desde luego.

51
00:02:04,510 --> 00:02:06,090
Pero en el contexto del día a día

52
00:02:06,090 --> 00:02:08,689
corporativo, padece una amnesia total sobre lo que

53
00:02:08,689 --> 00:02:09,430
realmente importa.

54
00:02:09,729 --> 00:02:11,110
No tiene ni idea de cuál es el

55
00:02:11,110 --> 00:02:12,889
protocolo de devoluciones, por ejemplo.

56
00:02:13,129 --> 00:02:14,469
Ni idea, para nada.

57
00:02:15,789 --> 00:02:16,150
Exactamente por eso.

58
00:02:16,250 --> 00:02:18,629
La misión de nuestra exploración de hoy es

59
00:02:18,629 --> 00:02:20,430
crucial para quien nos escucha.

60
00:02:20,530 --> 00:02:22,129
Vamos a sumergirnos de lleno.

61
00:02:22,310 --> 00:02:22,889
Así es.

62
00:02:22,990 --> 00:02:25,789
Vamos a analizar cómo RackFlow, que además es

63
00:02:25,789 --> 00:02:28,650
una plataforma de código abierto y completamente gratuita,

64
00:02:28,689 --> 00:02:31,050
ataca exactamente este cuello de botella.

65
00:02:31,169 --> 00:02:33,530
Y lo hace operando como un motor Rack,

66
00:02:33,550 --> 00:02:33,770
¿verdad?

67
00:02:33,889 --> 00:02:34,469
Exacto.

68
00:02:34,469 --> 00:02:37,110
Un motor de generación aumentada por recuperación.

69
00:02:37,310 --> 00:02:39,870
El objetivo de este análisis a fondo es

70
00:02:39,870 --> 00:02:42,789
destripar cómo esta herramienta consigue algo que, bueno,

71
00:02:42,830 --> 00:02:43,969
parece magia pura.

72
00:02:44,189 --> 00:02:45,770
Transforma la información estática.

73
00:02:45,789 --> 00:02:46,110
Sí.

74
00:02:46,629 --> 00:02:50,469
Transforma repositorios enteros de documentos, páginas web corporativas

75
00:02:50,469 --> 00:02:52,990
y esos PDFs infumables que nadie lee.

76
00:02:53,169 --> 00:02:54,550
Esos de 500 páginas.

77
00:02:54,550 --> 00:02:55,330
Madre mía.

78
00:02:55,469 --> 00:02:55,930
Esos mismos.

79
00:02:56,210 --> 00:02:59,409
Los convierte en una base de conocimientos dinámica,

80
00:02:59,409 --> 00:03:02,930
viva y perfectamente estructurada para alimentar a chatbots

81
00:03:02,930 --> 00:03:03,770
interactivos.

82
00:03:03,909 --> 00:03:06,789
O sea, la democratización definitiva de la IA

83
00:03:06,789 --> 00:03:07,650
avanzada.

84
00:03:07,810 --> 00:03:08,210
Eso es.

85
00:03:08,750 --> 00:03:11,530
Poniéndola al alcance de cualquier entidad sin requerir

86
00:03:11,530 --> 00:03:13,090
presupuestos astronómicos.

87
00:03:13,310 --> 00:03:15,389
Bueno, vamos a desgranar esto porque...

88
00:03:15,789 --> 00:03:16,650
La promesa es enorme.

89
00:03:16,909 --> 00:03:18,509
Y hay que empezar por el principio.

90
00:03:18,789 --> 00:03:19,830
Por los cimientos, claro.

91
00:03:19,990 --> 00:03:22,469
Antes de que esa flamante inteligencia artificial pueda

92
00:03:22,469 --> 00:03:25,750
ponerse a devorar manuales corporativos y a escupir

93
00:03:25,750 --> 00:03:29,150
respuestas magistrales, hay un paso previo ineludible.

94
00:03:29,469 --> 00:03:30,669
Saber dónde va a alojarse.

95
00:03:30,969 --> 00:03:31,490
Exacto.

96
00:03:31,509 --> 00:03:33,909
Decidir dónde va a vivir ese celebro digital.

97
00:03:34,409 --> 00:03:38,030
Porque, tradicionalmente, levantar y mantener este tipo de

98
00:03:38,030 --> 00:03:41,469
arquitecturas en servidores propios solía ser, bueno, una

99
00:03:41,469 --> 00:03:42,009
pesadilla.

100
00:03:42,169 --> 00:03:43,650
Un dolor de cabeza tremendo.

101
00:03:43,650 --> 00:03:46,669
Era el equivalente tecnológico a intentar construir un

102
00:03:46,669 --> 00:03:48,629
coche de Fórmula 1 desde cero en el

103
00:03:48,629 --> 00:03:49,270
garaje de casa.

104
00:03:49,509 --> 00:03:50,849
Ojo la analogía, que es muy buena.

105
00:03:51,050 --> 00:03:51,569
Es que es así.

106
00:03:51,750 --> 00:03:54,129
Se compran las piezas sueltas, se ensamblan y

107
00:03:54,129 --> 00:03:55,889
se reza fuerte para que el motor no

108
00:03:55,889 --> 00:03:57,129
explote en la primera curva.

109
00:03:57,229 --> 00:03:58,330
Y muchas veces explota.

110
00:03:58,729 --> 00:03:59,169
Totalmente.

111
00:03:59,490 --> 00:04:01,949
Y a ver, Ragflow, al ser de código

112
00:04:01,949 --> 00:04:05,889
abierto, permite precisamente esa vía del alojamiento propio,

113
00:04:06,050 --> 00:04:07,469
lo que se llama self -hosted.

114
00:04:07,849 --> 00:04:10,009
Para quien quiera aliarse la manta a la

115
00:04:10,009 --> 00:04:11,830
cabeza y montarlo en su servidor.

116
00:04:11,990 --> 00:04:12,629
Eso es.

117
00:04:12,629 --> 00:04:15,990
Pero la realidad es que existe una alternativa

118
00:04:15,990 --> 00:04:18,490
que altera por completo las reglas del juego.

119
00:04:18,810 --> 00:04:20,250
Las plataformas en la nube.

120
00:04:20,490 --> 00:04:21,050
Exacto.

121
00:04:21,310 --> 00:04:24,170
Plataformas de despliegue gestionado, como por ejemplo el

122
00:04:24,170 --> 00:04:24,550
Estio.

123
00:04:25,029 --> 00:04:27,389
Siguiendo con la analogía del coche, recurrir a

124
00:04:27,389 --> 00:04:29,850
esto sería como, digamos, hacer un renting.

125
00:04:30,149 --> 00:04:31,490
Un renting integral, sí.

126
00:04:31,629 --> 00:04:32,009
Claro.

127
00:04:32,050 --> 00:04:34,850
El vehículo llega impecable y el contrato ya

128
00:04:34,850 --> 00:04:37,670
incluye los mantenimientos preventivos, el seguro a todo

129
00:04:37,670 --> 00:04:39,310
riesgo y los cambios de aceite.

130
00:04:39,649 --> 00:04:42,470
Ojo, porque la analogía del renting es buenísima.

131
00:04:42,629 --> 00:04:44,569
Pero se queda corta si no miramos el

132
00:04:44,569 --> 00:04:46,629
coste de oportunidad real para una empresa.

133
00:04:46,910 --> 00:04:47,589
¿En qué sentido?

134
00:04:47,810 --> 00:04:49,069
Pues que no se trata solo de la

135
00:04:49,069 --> 00:04:51,149
comodidad de que te den el coche listo

136
00:04:51,149 --> 00:04:52,170
para conducir, ¿no?

137
00:04:52,490 --> 00:04:54,990
Se trata de la eliminación casi total de

138
00:04:54,990 --> 00:04:55,750
la barrera técnica.

139
00:04:56,410 --> 00:04:57,889
Esa barrera que frena todo.

140
00:04:58,310 --> 00:04:58,790
Claro.

141
00:04:59,089 --> 00:05:01,290
Es que esa barrera bloquea el 90 %

142
00:05:01,290 --> 00:05:03,449
de los proyectos de innovación hoy en día.

143
00:05:04,670 --> 00:05:07,269
Históricamente, el gran muro de contención no era

144
00:05:07,269 --> 00:05:08,149
el precio del software.

145
00:05:08,730 --> 00:05:10,970
Era el miedo a romper algo, estoy segura.

146
00:05:11,149 --> 00:05:12,610
Más bien el terror del departamento.

147
00:05:12,629 --> 00:05:13,689
El terror del departamento de infraestructura.

148
00:05:13,949 --> 00:05:17,110
Levantar un sistema complejo implica lidiar con dependencias,

149
00:05:17,269 --> 00:05:19,689
contenedores, actualizaciones constantes.

150
00:05:20,069 --> 00:05:22,350
Y el pánico absoluto a perder los datos.

151
00:05:22,709 --> 00:05:23,269
Exacto.

152
00:05:23,389 --> 00:05:25,790
Pero al utilizar una solución gestionada como el

153
00:05:25,790 --> 00:05:27,509
Estio, el proceso se vuelve invisible.

154
00:05:27,949 --> 00:05:29,449
Te quitas ese peso de encima.

155
00:05:29,769 --> 00:05:32,649
La plataforma subyacente asume el verdadero trabajo sucio.

156
00:05:32,970 --> 00:05:35,089
Hablamos de la gestión de copias de seguridad

157
00:05:35,089 --> 00:05:38,910
automatizadas, la monitorización, los parches críticos de seguridad.

158
00:05:39,269 --> 00:05:39,649
Claro.

159
00:05:39,730 --> 00:05:43,209
Y desde una perspectiva puramente estratégica, esto es

160
00:05:43,209 --> 00:05:43,449
oro.

161
00:05:43,829 --> 00:05:45,889
Permite que los equipos se enfoquen en lo

162
00:05:45,889 --> 00:05:48,449
que aporta valor, que es el conocimiento en

163
00:05:48,449 --> 00:05:48,649
sí.

164
00:05:48,889 --> 00:05:51,089
En vez de pelearse con la terminal de

165
00:05:51,089 --> 00:05:51,529
comandos.

166
00:05:51,769 --> 00:05:52,250
Eso es.

167
00:05:52,430 --> 00:05:54,930
De hecho, el despliegue es tan fluido que

168
00:05:54,930 --> 00:05:57,310
la principal preocupación pasa a ser puramente de

169
00:05:57,310 --> 00:05:57,970
arquitectura.

170
00:05:58,129 --> 00:06:01,029
Quien lidera el proyecto simplemente toma decisiones de

171
00:06:01,029 --> 00:06:01,509
alto nivel.

172
00:06:02,189 --> 00:06:04,290
Decisiones como la ubicación de los servidores.

173
00:06:05,209 --> 00:06:05,689
Exactamente.

174
00:06:05,689 --> 00:06:07,970
Elegir el proveedor en la nube más adecuado

175
00:06:07,970 --> 00:06:10,089
o decidir la región geográfica.

176
00:06:10,110 --> 00:06:12,310
Que a ver, este último detalle no es

177
00:06:12,310 --> 00:06:12,610
baladero.

178
00:06:12,629 --> 00:06:12,910
No es baladí, ¿eh?

179
00:06:12,910 --> 00:06:13,569
En absoluto.

180
00:06:13,610 --> 00:06:14,509
Hombre, para nada.

181
00:06:14,889 --> 00:06:17,689
En un entorno corporativo, decidir si los datos

182
00:06:17,689 --> 00:06:19,709
se alojan en Europa o en Estados Unidos

183
00:06:19,709 --> 00:06:22,370
lo cambia todo, a nivel de cumplimiento normativo

184
00:06:22,370 --> 00:06:23,209
y privacidad.

185
00:06:23,589 --> 00:06:24,069
Totalmente.

186
00:06:24,350 --> 00:06:26,470
La soberanía de los datos es un tema

187
00:06:26,470 --> 00:06:29,170
hipercrítico cuando hablamos de subir el know -how

188
00:06:29,170 --> 00:06:30,649
interno de una empresa a una IA.

189
00:06:30,750 --> 00:06:32,310
No se puede subir a cualquier sitio.

190
00:06:32,610 --> 00:06:33,170
Claro que no.

191
00:06:33,430 --> 00:06:36,670
Y otra decisión fundamental en esa fase es

192
00:06:36,670 --> 00:06:39,089
el nivel de soporte técnico que respalda la

193
00:06:39,089 --> 00:06:39,889
infraestructura.

194
00:06:39,970 --> 00:06:41,709
¿Y una vez definido todo eso?

195
00:06:42,629 --> 00:06:46,050
Una vez definidas esas variables estratégicas, el despliegue

196
00:06:46,050 --> 00:06:47,410
se ejecuta en segundo plano.

197
00:06:47,829 --> 00:06:50,470
Es la magia del código abierto combinado con

198
00:06:50,470 --> 00:06:51,490
el cloud gestionado.

199
00:06:51,629 --> 00:06:53,449
En cuestión de minutos lo tienes.

200
00:06:54,069 --> 00:06:54,589
Literalmente.

201
00:06:54,730 --> 00:06:57,269
Se pasa de no tener nada a disponer

202
00:06:57,269 --> 00:06:59,689
de un panel de control completo, con módulos

203
00:06:59,689 --> 00:07:02,250
de chat, agentes, bases de conocimiento.

204
00:07:02,610 --> 00:07:04,889
Todo listo para operar de forma privada.

205
00:07:05,069 --> 00:07:07,709
Vale, o sea, ya tenemos la casa construida,

206
00:07:07,709 --> 00:07:09,870
el servidor está blindado y tenemos las llaves

207
00:07:09,870 --> 00:07:10,629
en la mano.

208
00:07:10,629 --> 00:07:12,689
Ahora toca traer al inquilino.

209
00:07:13,149 --> 00:07:13,769
Exacto.

210
00:07:13,930 --> 00:07:15,730
Traer al inquilino inteligente.

211
00:07:15,889 --> 00:07:18,449
Hay que conectar el modelo de lenguaje, el

212
00:07:18,449 --> 00:07:21,769
LLM, y proporcionarle una biblioteca en condiciones.

213
00:07:22,370 --> 00:07:22,949
Eso es.

214
00:07:23,170 --> 00:07:25,930
Por defecto, Rackflow arranca con un modelo llamado

215
00:07:25,930 --> 00:07:27,230
Tongji Qiangwen.

216
00:07:27,370 --> 00:07:29,689
Pero, a ver, la verdadera potencia de una

217
00:07:29,689 --> 00:07:32,189
arquitectura abierta reside en su flexibilidad.

218
00:07:32,509 --> 00:07:33,089
Desde luego.

219
00:07:33,329 --> 00:07:35,329
Obligar a usar un único modelo sería un

220
00:07:35,329 --> 00:07:36,269
error garrafal.

221
00:07:36,389 --> 00:07:40,189
La plataforma brilla precisamente porque permite interconectar los

222
00:07:40,189 --> 00:07:40,610
motores de control.

223
00:07:40,610 --> 00:07:41,410
Pero, ¿qué pasa con los motores más potentes

224
00:07:41,410 --> 00:07:41,949
del mercado?

225
00:07:42,189 --> 00:07:44,430
La interoperabilidad es la palabra clave aquí.

226
00:07:44,589 --> 00:07:46,910
Aunque este modelo predeterminado tiene su utilidad para

227
00:07:46,910 --> 00:07:49,550
empezar, la arquitectura permite enchufar modelos de la

228
00:07:49,550 --> 00:07:50,370
talla de OpenEI.

229
00:07:50,589 --> 00:07:52,370
O incluso cosas más privadas, ¿no?

230
00:07:52,490 --> 00:07:52,930
Sí, sí.

231
00:07:52,990 --> 00:07:56,170
Instancias locales y 100 % privadas, utilizando Oyama

232
00:07:56,170 --> 00:07:58,449
o las últimas versiones de DeepSeq.

233
00:07:58,610 --> 00:08:00,110
¿Y es muy complicado conectarlos?

234
00:08:00,329 --> 00:08:00,649
Qué va.

235
00:08:00,790 --> 00:08:03,350
La conexión suele requerir únicamente la clave de

236
00:08:03,350 --> 00:08:05,350
la interfaz, la famosa API key.

237
00:08:05,490 --> 00:08:08,209
Se pega ahí y Rackflow empieza a comunicarse

238
00:08:08,209 --> 00:08:09,350
con el modelo al instante.

239
00:08:09,350 --> 00:08:10,350
Perfecto.

240
00:08:10,350 --> 00:08:13,490
Entonces, el cerebro ya está conectado y latiendo.

241
00:08:13,649 --> 00:08:17,069
El siguiente paso lógico es construir esa biblioteca

242
00:08:17,069 --> 00:08:18,250
de la que hablábamos.

243
00:08:18,490 --> 00:08:20,810
Crear la base de conocimientos pura y dura.

244
00:08:20,930 --> 00:08:21,569
Eso es.

245
00:08:22,269 --> 00:08:24,569
Imaginemos un caso práctico para la audiencia.

246
00:08:24,889 --> 00:08:26,709
Se crea un espacio de trabajo.

247
00:08:26,970 --> 00:08:30,050
Se le asigna un logotipo corporativo para que

248
00:08:30,050 --> 00:08:30,509
quede bonito.

249
00:08:30,709 --> 00:08:32,250
Se selecciona el idioma.

250
00:08:32,409 --> 00:08:34,210
Y se establecen los permisos de acceso.

251
00:08:34,549 --> 00:08:35,690
Muy importante, sí.

252
00:08:35,769 --> 00:08:39,330
Para determinar qué departamentos pueden consultar qué información.

253
00:08:39,870 --> 00:08:42,610
Pero, a ver, aquí es donde la curva

254
00:08:42,610 --> 00:08:45,309
de aprendizaje suele ponerse empinada.

255
00:08:45,629 --> 00:08:47,570
Ah, ya sé por dónde vas.

256
00:08:47,769 --> 00:08:50,210
Nos topamos con la jerga pura y dura

257
00:08:50,210 --> 00:08:50,769
del sector.

258
00:08:51,250 --> 00:08:53,990
Empezamos a oír hablar de los infames embeddings

259
00:08:53,990 --> 00:08:55,789
y de los métodos de chunking.

260
00:08:56,009 --> 00:08:58,370
Sí, la matemática oculta.

261
00:08:58,429 --> 00:08:59,830
Y a ver, voy a hacer de abogada

262
00:08:59,830 --> 00:09:01,029
del diablo un momento, ¿vale?

263
00:09:01,169 --> 00:09:01,690
Adelante.

264
00:09:01,789 --> 00:09:05,690
Es absolutamente vital entender toda esta matemática de

265
00:09:05,690 --> 00:09:07,649
vectores, embeddings y chunks.

266
00:09:07,889 --> 00:09:09,269
Es una pregunta súper lícita.

267
00:09:09,350 --> 00:09:12,509
Es que suena a una cantidad de terminología

268
00:09:12,509 --> 00:09:17,190
técnica completamente innecesaria para alguien que, francamente, lo

269
00:09:17,190 --> 00:09:19,889
único que desea es que un bot responda

270
00:09:19,889 --> 00:09:20,690
a dudas de un PDF.

271
00:09:21,110 --> 00:09:22,889
Ya, da la sensación de que hay que

272
00:09:22,889 --> 00:09:24,110
hacerle el trabajo a la máquina.

273
00:09:24,409 --> 00:09:24,649
Claro.

274
00:09:24,850 --> 00:09:27,090
Parece que hay que masticarle la comida a

275
00:09:27,090 --> 00:09:29,169
la IA para que su cerebro la digiera.

276
00:09:29,350 --> 00:09:32,049
Y el resultado visual, cuando ves esos chunks,

277
00:09:32,330 --> 00:09:33,370
parece un caos total.

278
00:09:33,649 --> 00:09:35,169
Es una excelente objeción, la verdad.

279
00:09:35,350 --> 00:09:37,009
Pero hay que aclarar que no es sólo

280
00:09:37,009 --> 00:09:37,929
masticar la comida.

281
00:09:37,929 --> 00:09:39,809
Es cambiar el idioma en el que está

282
00:09:39,809 --> 00:09:41,450
escrita la realidad para la máquina.

283
00:09:41,669 --> 00:09:43,190
A ver, explícame eso.

284
00:09:43,389 --> 00:09:45,889
Lo fascinante aquí es entender la mecánica oculta.

285
00:09:45,889 --> 00:09:48,090
Porque sin ella, todo el concepto de rack

286
00:09:48,090 --> 00:09:48,809
se desmorona.

287
00:09:48,929 --> 00:09:51,190
Un modelo de embedding no hace otra cosa

288
00:09:51,190 --> 00:09:53,230
que traducir el texto a coordenadas.

289
00:09:53,570 --> 00:09:56,190
Coordenadas hiperdimensionales, he leído por ahí.

290
00:09:56,490 --> 00:09:57,009
Exacto.

291
00:09:57,870 --> 00:10:00,090
Imaginemos una biblioteca gigantesca.

292
00:10:00,490 --> 00:10:03,149
Pero en lugar de ordenar los libros alfabéticamente

293
00:10:03,149 --> 00:10:06,090
por el autor, se ordenan físicamente por el

294
00:10:06,090 --> 00:10:07,909
sabor o la esencia de sus contenidos.

295
00:10:07,929 --> 00:10:09,830
Vale, me gusta la idea.

296
00:10:10,129 --> 00:10:13,490
En esta biblioteca abstracta, un libro sobre manzanas

297
00:10:13,490 --> 00:10:15,490
se coloca muy cerca de un libro sobre

298
00:10:15,490 --> 00:10:18,470
peras porque comparten la coordenada de fruta.

299
00:10:18,629 --> 00:10:19,289
Tiene sentido.

300
00:10:19,629 --> 00:10:22,070
Pero ambos están a kilómetros de distancia de

301
00:10:22,070 --> 00:10:24,470
un manual sobre, no sé, bujías de coche.

302
00:10:24,809 --> 00:10:25,970
Eso es un vector.

303
00:10:26,610 --> 00:10:29,409
Convierte conceptos abstractos en distancias matemáticas.

304
00:10:29,750 --> 00:10:31,450
Y así la IA busca más rápido.

305
00:10:31,690 --> 00:10:34,289
Claro, calcula similitudes a la velocidad de la

306
00:10:34,289 --> 00:10:34,549
luz.

307
00:10:34,750 --> 00:10:35,190
Vale.

308
00:10:35,289 --> 00:10:37,750
La analogía de la biblioteca aclara bastante.

309
00:10:37,929 --> 00:10:38,909
El tema de los embeddings.

310
00:10:39,049 --> 00:10:40,850
Pero, ¿qué ocurre con el chunking?

311
00:10:41,009 --> 00:10:41,830
La fragmentación.

312
00:10:42,029 --> 00:10:42,309
Sí.

313
00:10:42,509 --> 00:10:46,230
¿Por qué existe esa necesidad imperiosa de despedazar

314
00:10:46,230 --> 00:10:50,110
un documento que está perfectamente maquetado y estructurado?

315
00:10:50,370 --> 00:10:53,309
Porque los modelos de lenguaje, por muy avanzados

316
00:10:53,309 --> 00:10:55,830
que sean hoy, tienen una ventana de atención

317
00:10:55,830 --> 00:10:56,649
limitada.

318
00:10:56,769 --> 00:10:57,929
O sea que se pierden.

319
00:10:58,409 --> 00:10:58,889
Exacto.

320
00:10:58,950 --> 00:11:01,570
Si se introduce un manual técnico de 500

321
00:11:01,570 --> 00:11:04,610
páginas de golpe, la IA pierde el hilo.

322
00:11:04,909 --> 00:11:06,389
Olvida lo que le dio en la página

323
00:11:06,389 --> 00:11:07,909
2 al llegar a las 300.

324
00:11:07,909 --> 00:11:09,889
Como nos pasa a los humanos, vaya.

325
00:11:10,190 --> 00:11:10,669
Tal cual.

326
00:11:11,450 --> 00:11:14,929
El chunking soluciona esto troceando el documento en

327
00:11:14,929 --> 00:11:18,509
fragmentos manejables, con un ligero solapamiento entre ellos

328
00:11:18,509 --> 00:11:20,850
para no perder el contexto de las frases.

329
00:11:21,110 --> 00:11:21,649
Ya entiendo.

330
00:11:21,889 --> 00:11:24,250
¿Y sobre lo que comentaba antes del caos

331
00:11:24,250 --> 00:11:24,490
visual?

332
00:11:24,809 --> 00:11:25,769
Es muy pertinente.

333
00:11:26,129 --> 00:11:28,950
Cuando el sistema procesa el documento y muestra

334
00:11:28,950 --> 00:11:31,850
esos chunks resultantes en la pantalla, el texto

335
00:11:31,850 --> 00:11:33,210
aparece deslavazado.

336
00:11:33,350 --> 00:11:36,090
Lleno de etiquetas y metadatos rarísimos.

337
00:11:36,710 --> 00:11:36,929
Sí.

338
00:11:36,929 --> 00:11:39,049
No se ve nada bonito ni es fácilmente

339
00:11:39,049 --> 00:11:40,250
elegible para un ojo humano.

340
00:11:40,529 --> 00:11:43,190
Pero hay que asimilar que ese formato fragmentado

341
00:11:43,190 --> 00:11:44,549
no está diseñado para nosotros.

342
00:11:45,009 --> 00:11:46,129
Está hecho para la máquina.

343
00:11:46,470 --> 00:11:46,950
Exacto.

344
00:11:47,009 --> 00:11:49,330
Es la estructura más eficiente para que la

345
00:11:49,330 --> 00:11:52,470
máquina indexe y recupere el conocimiento con precisión

346
00:11:52,470 --> 00:11:52,990
quirúrgica.

347
00:11:53,190 --> 00:11:53,590
Vale.

348
00:11:54,090 --> 00:11:56,289
Entonces, ¿quien gestiona esto no tiene que ser

349
00:11:56,289 --> 00:11:58,070
un experto en álgebra vectorial?

350
00:11:58,190 --> 00:11:58,710
Para nada.

351
00:11:58,830 --> 00:12:01,570
La plataforma ya proporciona parámetros por defecto que

352
00:12:01,570 --> 00:12:02,990
asumen todo este trabajo pesado.

353
00:12:03,129 --> 00:12:03,690
Menos mal.

354
00:12:03,970 --> 00:12:05,789
Porque a la hora de alimentar al sistema,

355
00:12:05,970 --> 00:12:08,049
el enfoque… resulta súper práctico.

356
00:12:08,870 --> 00:12:11,009
Imaginemos que el equipo de soporte guarda una

357
00:12:11,009 --> 00:12:13,629
web de preguntas frecuentes en PDF y las

358
00:12:13,629 --> 00:12:13,929
sube.

359
00:12:14,070 --> 00:12:15,690
La arrastra al panel y listo.

360
00:12:15,710 --> 00:12:16,309
Eso es.

361
00:12:16,370 --> 00:12:18,769
El motor aplica esa magia de los embeddings,

362
00:12:18,929 --> 00:12:20,929
trocea el texto y lo indexa solo.

363
00:12:21,110 --> 00:12:24,169
Y de cara a escenarios empresariales, resulta interesantísimo

364
00:12:24,169 --> 00:12:25,429
ver hacia dónde va esto.

365
00:12:25,669 --> 00:12:27,029
¿Hacia la automatización total?

366
00:12:27,669 --> 00:12:28,190
Exacto.

367
00:12:28,230 --> 00:12:29,750
La sincronización automatizada.

368
00:12:30,009 --> 00:12:32,610
En lugar de arrastrar archivos manualmente, el sistema

369
00:12:32,610 --> 00:12:35,529
permite conectar repositorios masivos en la nube, como

370
00:12:35,529 --> 00:12:36,309
Amazon S3.

371
00:12:36,649 --> 00:12:37,990
O sea que la base se actualiza sola.

372
00:12:38,450 --> 00:12:39,009
Literalmente.

373
00:12:39,389 --> 00:12:41,730
En cuanto alguien sube un documento nuevo al

374
00:12:41,730 --> 00:12:44,110
servidor interno de la empresa, la IA se

375
00:12:44,110 --> 00:12:44,789
lo aprende.

376
00:12:44,970 --> 00:12:47,529
Y esa automatización de la ingesta de datos

377
00:12:47,529 --> 00:12:50,409
es lo que transforma un simple experimento curioso

378
00:12:50,409 --> 00:12:52,809
en una herramienta seria, de grado impresarial.

379
00:12:53,269 --> 00:12:53,830
Totalmente.

380
00:12:53,970 --> 00:12:56,629
Pero, claro, una vez que ese PDF está

381
00:12:56,629 --> 00:13:00,570
digerido y convertido en coordenadas matemáticas, surge un

382
00:13:00,570 --> 00:13:01,690
reto de confianza monumental.

383
00:13:02,169 --> 00:13:04,350
El gran elefante en la habitación.

384
00:13:04,509 --> 00:13:06,049
Cómo se audita una caja negra.

385
00:13:06,649 --> 00:13:07,289
Esa es una pregunta clave.

386
00:13:07,509 --> 00:13:10,450
Claro, trocear el documento y pasarlo a vectores

387
00:13:10,450 --> 00:13:14,090
suena super eficiente en teoría, pero el miedo

388
00:13:14,090 --> 00:13:14,929
siempre es el mismo.

389
00:13:15,129 --> 00:13:16,149
¿Nos podemos fiar?

390
00:13:16,529 --> 00:13:17,009
Exacto.

391
00:13:17,230 --> 00:13:19,990
El miedo en cualquier consejo de administración es,

392
00:13:20,149 --> 00:13:22,549
¿cómo nos fiamos de que la máquina realmente

393
00:13:22,549 --> 00:13:24,769
se ha enterado de algo antes de poner

394
00:13:24,769 --> 00:13:26,350
a este bot a hablar con clientes?

395
00:13:26,490 --> 00:13:28,389
¿No se puede simplemente cruzar los dedos?

396
00:13:28,570 --> 00:13:29,730
Desde luego que no.

397
00:13:29,809 --> 00:13:31,389
Y por eso no se cruzan.

398
00:13:31,509 --> 00:13:34,009
Se implementan pruebas de recuperación.

399
00:13:34,090 --> 00:13:36,330
El famoso Retrieval Testing.

400
00:13:36,649 --> 00:13:38,149
Las pruebas de fuego.

401
00:13:38,409 --> 00:13:38,870
Eso es.

402
00:13:39,230 --> 00:13:41,269
Antes de que el modelo formule una frase

403
00:13:41,269 --> 00:13:43,750
completa, hay que verificar que el motor de

404
00:13:43,750 --> 00:13:44,990
búsqueda interno funciona.

405
00:13:45,289 --> 00:13:48,970
Se introducen términos críticos, como tiempos de respuesta.

406
00:13:49,350 --> 00:13:51,149
Para ver si pesca el dato correcto.

407
00:13:51,230 --> 00:13:54,389
Para observar exactamente qué fragmentos rescata la base

408
00:13:54,389 --> 00:13:56,570
de datos de entre sus miles de vectores.

409
00:13:56,789 --> 00:13:59,289
Pero no basta con encontrar coincidencias sueltas.

410
00:13:59,450 --> 00:14:00,769
Claro, habrá mucho ruido.

411
00:14:00,769 --> 00:14:01,090
Muchísimo.

412
00:14:01,590 --> 00:14:03,490
Aquí entra en juego un concepto vital.

413
00:14:03,889 --> 00:14:05,789
El modelo de reclasificación.

414
00:14:05,789 --> 00:14:07,110
O re -rank.

415
00:14:07,450 --> 00:14:08,169
Un momento.

416
00:14:08,649 --> 00:14:09,129
Reclasificación.

417
00:14:09,690 --> 00:14:10,110
Sí, sí.

418
00:14:10,370 --> 00:14:12,710
Si el sistema ya ha buscado los vectores

419
00:14:12,710 --> 00:14:16,090
más cercanos en nuestra famosa biblioteca de sabores,

420
00:14:16,169 --> 00:14:18,009
¿para qué necesita volver a clasificar nada?

421
00:14:18,230 --> 00:14:19,269
Parece redundante.

422
00:14:19,509 --> 00:14:21,769
Podría parecerlo, pero es un doble filtro de

423
00:14:21,769 --> 00:14:23,809
calidad imprescindible, te lo aseguro.

424
00:14:24,090 --> 00:14:26,909
La primera búsqueda vectorial es muy rápida, pero

425
00:14:26,909 --> 00:14:27,570
muy amplia.

426
00:14:27,690 --> 00:14:29,009
O sea, trae de todo un poco.

427
00:14:29,250 --> 00:14:32,409
Puede rescatar 50 fragmentos que hablan vagamente de

428
00:14:32,409 --> 00:14:33,629
reembolsos, por ejemplo.

429
00:14:33,629 --> 00:14:36,070
Pero muchos podrían estar fuera de contexto.

430
00:14:36,309 --> 00:14:36,629
Vale.

431
00:14:36,809 --> 00:14:38,870
El modelo de re -rank es un modelo

432
00:14:38,870 --> 00:14:41,389
más lento y analítico, que toma esos 50

433
00:14:41,389 --> 00:14:44,429
resultados y los somete a un escrutinio profundo

434
00:14:44,429 --> 00:14:45,690
contra la pregunta original.

435
00:14:46,009 --> 00:14:47,090
O sea, ¿hace una criba?

436
00:14:47,350 --> 00:14:49,370
Descarta el ruido y ordena los tres o

437
00:14:49,370 --> 00:14:51,649
cuatro fragmentos verdaderamente cruciales.

438
00:14:51,809 --> 00:14:54,649
Y sólo esa información hiperrefinada es la que

439
00:14:54,649 --> 00:14:56,429
se le entrega a la IA para redactar

440
00:14:56,429 --> 00:14:56,809
la respuesta.

441
00:14:57,169 --> 00:14:57,929
Es brillante.

442
00:14:58,289 --> 00:15:00,669
Y aquí es donde se pone verdaderamente interesante

443
00:15:00,669 --> 00:15:01,990
la aplicación práctica.

444
00:15:01,990 --> 00:15:05,210
Una vez verificado que los engranajes funcionan gracias

445
00:15:05,210 --> 00:15:07,850
a ese doble filtro, se crea el asistente.

446
00:15:07,990 --> 00:15:09,990
El chatbot final con el que interactúa el

447
00:15:09,990 --> 00:15:10,409
usuario.

448
00:15:10,750 --> 00:15:11,350
Exacto.

449
00:15:11,730 --> 00:15:15,049
Se define su personalidad, el tono, si tiene

450
00:15:15,049 --> 00:15:18,029
un avatar… Pero hay una configuración concreta que

451
00:15:18,029 --> 00:15:19,769
me parece un salvavidas absoluto.

452
00:15:19,950 --> 00:15:23,029
La respuesta de vacío o empty response.

453
00:15:23,769 --> 00:15:25,929
Uff, esa función es clave.

454
00:15:26,169 --> 00:15:29,389
Permite programar con exactitud qué debe articular la

455
00:15:29,389 --> 00:15:31,409
IA cuando busca en los vectores y descubre

456
00:15:31,409 --> 00:15:31,970
que no tiene respuesta.

457
00:15:32,830 --> 00:15:35,690
Algo simple como, no lo sé, preguntaré a

458
00:15:35,690 --> 00:15:36,090
soporte.

459
00:15:36,289 --> 00:15:38,750
Hay que detenerse en este punto, porque supone

460
00:15:38,750 --> 00:15:39,970
un cambio cultural inmenso.

461
00:15:40,610 --> 00:15:42,049
¿En nuestra relación con la IA?

462
00:15:42,169 --> 00:15:42,389
Sí.

463
00:15:42,529 --> 00:15:44,690
El gran problema de la IA generativa actual,

464
00:15:44,909 --> 00:15:47,669
su talón de Aquiles, son las alucinaciones.

465
00:15:48,070 --> 00:15:51,470
Esa tendencia casi patológica a inventarse respuestas y

466
00:15:51,470 --> 00:15:51,769
fechas.

467
00:15:51,950 --> 00:15:53,690
Con una seguridad pasmosa, además.

468
00:15:54,029 --> 00:15:54,470
Exacto.

469
00:15:54,610 --> 00:15:56,809
Cuando se encuentra en un callejón sin salida,

470
00:15:56,830 --> 00:15:57,549
se lo inventa.

471
00:15:58,169 --> 00:16:00,909
En el entorno corporativo se penaliza mucho decir,

472
00:16:01,009 --> 00:16:01,769
no lo sé.

473
00:16:01,970 --> 00:16:05,309
Pero hablando de algoritmos, la honestidad algorítmica vale

474
00:16:05,309 --> 00:16:05,590
oro.

475
00:16:05,830 --> 00:16:07,610
Es infinitamente preferible, claro.

476
00:16:07,769 --> 00:16:10,789
Es preferible un asistente que admita sus limitaciones

477
00:16:10,789 --> 00:16:13,370
y detenga el proceso, antes que un bot

478
00:16:13,370 --> 00:16:16,690
que decida inventarse, no sé, una promoción del

479
00:16:16,690 --> 00:16:18,330
50 % de descuento.

480
00:16:18,529 --> 00:16:21,090
Que provoca una crisis de relaciones públicas en

481
00:16:21,090 --> 00:16:21,370
segundos.

482
00:16:21,809 --> 00:16:22,309
Tal cual.

483
00:16:22,690 --> 00:16:23,649
Totalmente de acuerdo.

484
00:16:23,870 --> 00:16:26,070
Es honestidad por diseño.

485
00:16:26,269 --> 00:16:28,169
Y esto enlaza con el otro pilar de

486
00:16:28,169 --> 00:16:31,070
la confianza, para quien nos escucha, la trazabilidad.

487
00:16:31,070 --> 00:16:32,389
Ah, las citas.

488
00:16:32,830 --> 00:16:33,429
Exacto.

489
00:16:33,490 --> 00:16:35,909
Cuando el asistente entra en acción y se

490
00:16:35,909 --> 00:16:38,529
le hace una pregunta compleja, devuelve una respuesta

491
00:16:38,529 --> 00:16:42,629
maravillosamente estructurada con sus negritas y viñetas.

492
00:16:42,990 --> 00:16:44,950
Nada que ver con los chunks feos de

493
00:16:44,950 --> 00:16:45,210
antes.

494
00:16:45,549 --> 00:16:46,049
Para nada.

495
00:16:46,330 --> 00:16:48,610
Pero la joya de la corona aparece al

496
00:16:48,610 --> 00:16:48,850
final.

497
00:16:49,009 --> 00:16:52,169
El sistema incluye una cita precisa indicando de

498
00:16:52,169 --> 00:16:55,049
qué PDF e incluso de qué párrafo exacto

499
00:16:55,049 --> 00:16:56,149
ha extraído el dato.

500
00:16:56,450 --> 00:16:57,870
Es vital para auditar.

501
00:16:58,129 --> 00:17:00,889
Es como tener a un analista junior que…

502
00:17:00,889 --> 00:17:04,289
No sólo entrega un resumen impecable, sino que…

503
00:17:04,289 --> 00:17:07,710
Coloca el manual abierto por la página exacta

504
00:17:07,710 --> 00:17:08,670
de la evidencia.

505
00:17:08,970 --> 00:17:11,650
Esa es la gran diferencia entre un generador

506
00:17:11,650 --> 00:17:13,890
de texto al uso y un sistema de

507
00:17:13,890 --> 00:17:15,309
gestión del conocimiento real.

508
00:17:15,589 --> 00:17:17,470
Si hay dudas, se revisa la cita.

509
00:17:17,549 --> 00:17:19,130
La fuente siempre es auditable.

510
00:17:19,789 --> 00:17:20,549
Transparencia total.

511
00:17:20,849 --> 00:17:23,769
Y además, la arquitectura permite pivotar sobre la

512
00:17:23,769 --> 00:17:24,170
marcha.

513
00:17:24,210 --> 00:17:26,289
Si se percibe que el modelo es demasiado

514
00:17:26,289 --> 00:17:28,809
lento razonando, se cambia el motor por otro

515
00:17:28,809 --> 00:17:30,349
más ágil, como un modelo mini.

516
00:17:30,890 --> 00:17:33,329
Sin reconstruir toda la base de datos.

517
00:17:33,569 --> 00:17:34,329
¡Qué pasada!

518
00:17:34,730 --> 00:17:38,829
Todo esto dibuja un ecosistema fantástico y ultraseguro.

519
00:17:38,869 --> 00:17:41,269
Pero… presenta un límite claro.

520
00:17:41,869 --> 00:17:42,130
A ver.

521
00:17:42,269 --> 00:17:45,990
Hasta aquí hemos analizado un cerebro brillante encerrado

522
00:17:45,990 --> 00:17:48,569
en una habitación llena de archivadores estáticos.

523
00:17:48,930 --> 00:17:51,789
Pero, ¿qué ocurre cuando la realidad supera esos

524
00:17:51,789 --> 00:17:52,569
documentos?

525
00:17:52,750 --> 00:17:54,049
El mundo exterior, claro.

526
00:17:54,250 --> 00:17:56,970
Las normativas de la empresa pueden ser fijas,

527
00:17:56,970 --> 00:17:58,589
pero el mundo cambia cada segundo.

528
00:17:58,589 --> 00:18:01,049
¿Qué pasa si la respuesta depende de conocer

529
00:18:01,049 --> 00:18:03,329
una noticia publicada hace tres horas?

530
00:18:03,589 --> 00:18:04,869
O el estado de la bolsa.

531
00:18:05,210 --> 00:18:05,730
Exacto.

532
00:18:05,930 --> 00:18:08,430
Datos que simplemente nunca se incluyeron en los

533
00:18:08,430 --> 00:18:09,450
PDFs de la empresa.

534
00:18:09,769 --> 00:18:12,970
Ahí es donde la tecnología RAC tradicional choca

535
00:18:12,970 --> 00:18:13,730
contra un muro.

536
00:18:13,890 --> 00:18:16,509
Un modelo entrenado hace un año, con PDFs

537
00:18:16,509 --> 00:18:18,529
de hace un mes, no puede responder a

538
00:18:18,529 --> 00:18:19,369
una crisis de hoy.

539
00:18:19,930 --> 00:18:20,450
Lógico.

540
00:18:20,509 --> 00:18:23,089
Para romper ese aislamiento, se requiere una capa

541
00:18:23,089 --> 00:18:25,869
superior de autonomía, la orquestación de agentes.

542
00:18:25,869 --> 00:18:29,130
Esto transforma un sistema pasivo en un investigador

543
00:18:29,130 --> 00:18:30,210
activo que sale a Internet.

544
00:18:30,569 --> 00:18:32,650
Y el método para construir estos agentes es

545
00:18:32,650 --> 00:18:33,190
fascinante.

546
00:18:33,369 --> 00:18:35,789
Quien espere ver pantallas negras llenas de código

547
00:18:35,789 --> 00:18:37,549
se llevará una sorpresa masiva.

548
00:18:37,650 --> 00:18:38,569
Súper accesible.

549
00:18:38,730 --> 00:18:41,069
La interfaz se basa en nodos visuales.

550
00:18:41,170 --> 00:18:44,430
Para conceptualizarlo, es muy parecido a plataformas como

551
00:18:44,430 --> 00:18:47,430
N8N o incluso a jugar con piezas de

552
00:18:47,430 --> 00:18:48,170
LEGO lógicas.

553
00:18:48,369 --> 00:18:50,630
Arrastrar y soltar cajitas, básicamente.

554
00:18:51,049 --> 00:18:51,430
Eso es.

555
00:18:51,549 --> 00:18:55,470
Permite diseñar flujos complejos arrastrando cajas y conectándolas

556
00:18:55,470 --> 00:18:55,849
con fuentes.

557
00:18:55,849 --> 00:18:58,529
Y un detalle brillante es que cada caja

558
00:18:58,529 --> 00:19:01,190
viene con comentarios didácticos explicando su función.

559
00:19:01,490 --> 00:19:03,789
Y ojo, que el diseño basado en nodos

560
00:19:03,789 --> 00:19:05,509
no es un simple lavado de cara estético.

561
00:19:05,710 --> 00:19:06,170
No.

562
00:19:06,390 --> 00:19:08,650
Es una abstracción conceptual poderosísima.

563
00:19:08,829 --> 00:19:11,529
Permite que mentes no técnicas, pero que conocen

564
00:19:11,529 --> 00:19:13,950
bien el negocio, puedan diseñar la lógica.

565
00:19:14,190 --> 00:19:15,589
Diseñar sin picar código.

566
00:19:15,950 --> 00:19:16,509
Exacto.

567
00:19:16,549 --> 00:19:18,569
Una fente de búsqueda web no es más

568
00:19:18,569 --> 00:19:19,470
que una secuencia.

569
00:19:19,869 --> 00:19:23,769
Recibir pregunta, extraer palabras clave, buscar en Internet,

570
00:19:24,009 --> 00:19:27,230
leer resultados, combinar con datos internos y responder.

571
00:19:27,569 --> 00:19:29,690
Pero claro, la teoría es preciosa hasta que

572
00:19:29,690 --> 00:19:31,170
el código choca con la realidad.

573
00:19:31,630 --> 00:19:34,009
Imaginemos que ensamblamos esas piezas de LEGO para

574
00:19:34,009 --> 00:19:36,349
preguntar la fecha de nacimiento de Napoleón.

575
00:19:36,450 --> 00:19:37,349
Un ejemplo clásico.

576
00:19:37,609 --> 00:19:39,450
Se le da el botón de ejecutar y…

577
00:19:39,450 --> 00:19:42,869
el sistema colapsa en vivo.

578
00:19:43,230 --> 00:19:44,089
Lanza un error.

579
00:19:44,349 --> 00:19:45,990
Pasa en las mejores familias.

580
00:19:46,190 --> 00:19:48,690
Pero lejos de ser un drama, estos fallos

581
00:19:48,690 --> 00:19:51,210
resultan ser la mejor clase magistral.

582
00:19:51,589 --> 00:19:53,690
El fallo no ocurre porque la IA sea

583
00:19:53,690 --> 00:19:54,069
tonta.

584
00:19:54,069 --> 00:19:56,390
Suele ser un tema de configuración.

585
00:19:56,529 --> 00:19:59,809
En ese cirujo específico, el sistema estaba configurado

586
00:19:59,809 --> 00:20:01,470
para llamar a un modelo de deep -seq

587
00:20:01,470 --> 00:20:03,809
que no tenía los permisos habilitados en ese

588
00:20:03,809 --> 00:20:04,109
momento.

589
00:20:04,390 --> 00:20:07,029
Y la resolución de ese incidente ilustra el

590
00:20:07,029 --> 00:20:09,509
verdadero cambio de paradigma en el mantenimiento del

591
00:20:09,509 --> 00:20:09,829
software.

592
00:20:10,230 --> 00:20:11,970
Es facilísimo de arreglar.

593
00:20:12,289 --> 00:20:14,509
Hace unos años, solucionar un error de llamadas

594
00:20:14,509 --> 00:20:17,049
a una API requería bucear entre cientos de

595
00:20:17,049 --> 00:20:19,849
líneas de código, leer logs crípticos y cruzar

596
00:20:19,849 --> 00:20:20,410
los dedos.

597
00:20:20,509 --> 00:20:21,369
Una tortura.

598
00:20:21,509 --> 00:20:24,049
En este entorno visual, el error se ilumina.

599
00:20:24,049 --> 00:20:26,190
Se ilumina directamente en las cajitas afectadas, en

600
00:20:26,190 --> 00:20:26,549
rojo.

601
00:20:26,650 --> 00:20:29,990
La solución pasa únicamente por identificar esos nodos.

602
00:20:30,029 --> 00:20:32,029
El de refinar la pregunta y el de

603
00:20:32,029 --> 00:20:33,529
generar la respuesta, por ejemplo.

604
00:20:33,789 --> 00:20:34,390
Exacto.

605
00:20:34,690 --> 00:20:38,029
Abrirlos y, con un menú desplegable, reemplazar el

606
00:20:38,029 --> 00:20:39,670
motor ausente por uno activo.

607
00:20:39,750 --> 00:20:42,430
Como la versión mini de GPT -4.

608
00:20:42,710 --> 00:20:43,390
Y a correr.

609
00:20:44,089 --> 00:20:44,690
Efectivamente.

610
00:20:45,029 --> 00:20:48,089
Se aplican los cambios, se vuelve a ejecutar

611
00:20:48,089 --> 00:20:51,329
y esta vez el flujo es hipnótico.

612
00:20:51,329 --> 00:20:54,369
Se puede ver cómo la información viaja por

613
00:20:54,369 --> 00:20:56,410
las flechas, cómo busca la fecha.

614
00:20:56,490 --> 00:20:57,670
El 15 de agosto, claro.

615
00:20:57,849 --> 00:20:58,390
Eso es.

616
00:20:58,470 --> 00:21:01,309
Y cómo entrega la respuesta final añadiendo el

617
00:21:01,309 --> 00:21:03,670
enlace a Wikipedia como prueba de su investigación

618
00:21:03,670 --> 00:21:04,609
en tiempo real.

619
00:21:04,869 --> 00:21:07,250
Esto pantea una cuestión que trasciende la simple

620
00:21:07,250 --> 00:21:08,710
automatización de tareas.

621
00:21:08,970 --> 00:21:10,670
Dotar a un modelo de lenguaje de la

622
00:21:10,670 --> 00:21:12,470
capacidad de orquestar búsquedas web.

623
00:21:12,630 --> 00:21:13,250
Lo cambia todo.

624
00:21:13,630 --> 00:21:15,869
Destruye para siempre la barrera del corte de

625
00:21:15,869 --> 00:21:16,450
conocimiento.

626
00:21:16,630 --> 00:21:18,750
La IA ya no está limitada por los

627
00:21:18,750 --> 00:21:20,309
datos con los que fue entrenada en el

628
00:21:20,309 --> 00:21:20,569
pasado.

629
00:21:20,569 --> 00:21:22,269
Es la fusión definitiva.

630
00:21:22,470 --> 00:21:22,990
Totalmente.

631
00:21:23,130 --> 00:21:25,710
Por un lado, se dispone del conocimiento privado

632
00:21:25,710 --> 00:21:27,569
de la empresa y, por otro, de la

633
00:21:27,569 --> 00:21:29,069
inmensidad de datos de Internet.

634
00:21:29,369 --> 00:21:32,089
Y el puente es un sistema visual para

635
00:21:32,089 --> 00:21:34,650
que cualquiera construya empleados digitales.

636
00:21:34,990 --> 00:21:37,950
Se democratiza el rol de ingeniero de automatización,

637
00:21:38,170 --> 00:21:38,750
desde luego.

638
00:21:39,049 --> 00:21:41,650
Y para terminar de consolidar todas las piezas

639
00:21:41,650 --> 00:21:45,250
de este rompecabezas, resulta interesante plantear una reflexión.

640
00:21:45,609 --> 00:21:46,809
A ver, cuéntanos.

641
00:21:47,049 --> 00:21:49,410
Una reflexión de cara al futuro a corto

642
00:21:49,410 --> 00:21:49,730
plazo.

643
00:21:49,730 --> 00:21:53,930
Hemos diseccionado cómo ecosistemas gratuitos de código abierto

644
00:21:53,930 --> 00:21:57,269
eliminan la fricción para crear sistemas hipercomplejos.

645
00:21:57,529 --> 00:21:59,990
Sistemas con memoria y trazabilidad.

646
00:22:00,450 --> 00:22:01,049
Exacto.

647
00:22:01,049 --> 00:22:02,750
Y con honestidad algorítmica.

648
00:22:02,970 --> 00:22:05,430
Si la barrera técnica y financiera ha quedado

649
00:22:05,430 --> 00:22:08,109
reducida a cenizas, ¿cómo va a cambiar esto

650
00:22:08,109 --> 00:22:10,210
la arquitectura de los departamentos corporativos?

651
00:22:10,549 --> 00:22:12,049
Uf, es una gran pregunta.

652
00:22:12,410 --> 00:22:15,569
¿Cómo evolucionará el estudio académico y la síntesis

653
00:22:15,569 --> 00:22:17,869
de información masiva en la próxima década?

654
00:22:17,869 --> 00:22:19,769
Va a ser un salto tremendo.

655
00:22:19,970 --> 00:22:22,450
Resulta evidente que el límite ya no reside

656
00:22:22,450 --> 00:22:25,029
en los presupuestos de servidores, ni en la

657
00:22:25,029 --> 00:22:26,049
complejidad del código.

658
00:22:26,390 --> 00:22:30,009
La última frontera es nuestra propia imaginación para

659
00:22:30,009 --> 00:22:32,329
diseñar los flujos de trabajo de la próxima

660
00:22:32,329 --> 00:22:32,710
era.

661
00:22:32,990 --> 00:22:36,369
Antes de despedirnos hasta el próximo programa, os

662
00:22:36,369 --> 00:22:38,410
informamos de que las voces que oyes han

663
00:22:38,410 --> 00:22:41,029
sido generadas por la IAE de Notebook LM,

664
00:22:41,289 --> 00:22:44,109
y que dirigiendo el podcast se encuentra Julio

665
00:22:44,109 --> 00:22:46,609
Pablo Vázquez, un humano que te envía saludos.

666
00:22:46,609 --> 00:22:49,589
En caso de error, probablemente sean errores humanos.

667
00:22:49,990 --> 00:22:51,130
¿Nos escuchamos?

668
00:22:51,450 --> 00:23:04,420
Y hasta aquí el episodio de hoy.

669
00:23:04,559 --> 00:23:06,359
Muchas gracias por tu atención.

670
00:23:15,819 --> 00:23:17,779
Esto es BIMpraxis.

671
00:23:18,079 --> 00:23:20,579
Nos escuchamos en el próximo episodio.

