Sacar partido a tu información privada con IA

Qué es un RAG y por qué te interesa mucho crearte uno

Imagina que tienes un montón de documentos en tu ordenador.

Esos documentos pueden tener diversos formatos (word, excel, pdf, html, videos, imágenes)

Si quieres explotar esa información ingente almacenada y que es de tipo personal o corporativa hasta ahora podías hacer un índice y ponerte a leerla. 

¿Por qué no crear un ChatGPT privado que puedas usar para dar soporte a tus clientes, explicar un procedimiento interno a la gente de tu empresa o simplemente crear resúmenes de lo que tienes guardado para poder sacarle partido?

Podrías pensar en crear tu propio modelo de lenguaje al que entrenar con estos datos pero probablemente no vas a conseguir la potencia de un LLM ya creado y te va a llevar tiempo y mucho dinero, unos cuantos cientos de millones de dolares para el caso de chatGPT de OpenAI, Gemini de Google, LLama de Facebook, etc. Puedes aprovechar esos modelos ya creados y entrenados y añadir tu propia capa de datos de forma privada.

Si necesitas extraer información precisa de toda esa cantidad de datos almacenada, quizá durante meses o años ahora puedes construir un agente de IA, un sistema que te permita aprovecharla usando un nuevo sistema.

La idea es:

1.- Usar una herramienta que cree una capa sobre un modelo LLM para que analice tu informacion privada y la añada a un LLM gigantesco del tipo de los que venimos hablando, manteniendo la privacidad estricta de tus datos.

2.- Descargar o usar on line uno de estos modelos LLM amplificados («aumentados») con tu propia informacion privada local.

A esto se le ha puesto ya un nombre. Se le llama RAG (Retriever-Augmented Generation)

El proceso consiste en convertir tu información privada en un formato que pueda complementar a un modelo de lenguaje («LLM») ya existente y ya entrenado como son ChatGPT 4 o LLama 3 o Gemini o el que sea. Estos modelos ya entrenados usan representaciones de la información en formato numérico como vectores y se almacenan en bases de datos especiales para utilizar estos vectores. Cuando se integra la nueva información transformada en vectores a la base de datos se dice que se ha «embebido» la nueva información en el modelo de lenguaje LLM.

El método para transformar tu información consiste en hacer trozos de texto con una técnica llamada chunking. El chunking utiliza técnicas para separar la informacion en trozos coherentes. La mas precisa se basa en analizar semánticamente el texto y cortarlo en trozos con significado. Podrías cortar el texto buscando los puntos finales de las frases o cualquier marca que indique que es un párrafo pero lo mejor es cortar el texto cuando la frase cortada tiene algun tipo de significado.

Luego, una vez tienes esos trozos «chunks» lo que se hace es convertirlo en una cadena de números llamada vector y almacenando ese vector junto a otros vectores que tienen un significado «semántico» similar.

Cómo obtener un sistema al que pueda preguntar y saltandome los detalles técnicos

Puedes usar un entorno python, importar librerias y componentes y luego crear esa base de datos vectorial «aumentada» con herramientas como langchain pero te traigo una nueva herramienta gratuita que hace todo esto automáticamente para tí: AnythingLLM

Esta herramienta te permite transformar toda la información sobre un tema en concreto (o general) que tengas en un complemento a un LLM gigante como ChatGPT o cualquiera de los otros y luego poder interrogar o pedir al LLM aumentado para pedir informes, versiones nuevas de la información, resúmenes o averiguar cualquier información que necesites.

Vamos a verlo paso a paso

Paso 1 Descarga AnythingLLM

Si es para windows te va a advertir que este programa no va firmado por un fabricante. No importa. Es seguro. Ejecuta el instalador igualmente

Descarga en la web de AnythingLLM

Paso 2 Añade tu documentación propia al modelo LLM

Esto se hace creando un espacio de trabajo o «workspace». Puedes hacerlo tan genérico o específico como necesites. P.e. si estás documentando como funciona un procedimiento de calidad o una máquina tendrás en tu ordenador algunas carpetas con archivos en pdf, word, etc que quieras que el modelo de lenguaje incorpore a su base de datos pero sin compartirlo con nadie y que lo guarde localmente en tu sistema.

Dentro de un «workspace» puedes subir la información privada que necesites:

elige los ficheros para el workspace

Paso 3. Seleccionar el modelo LLM y configurar opciones

Pulsa en la llave inglesa que da acceso al menu de configuración.

Yo he elegido mi cuenta de OpenAI (fabricante de chatGPT) y la version gpt-4o. 

Esto significa que tengo una clave API que he creado en https://platform.openai.com y que puede haber un coste por uso aunque sea muy bajo (menos de 5 USD/mes). Pero puedes usar un LLM gratis y potente como LLAMA que es de Meta.

Además puedes elegir varias opciones. Si lo dejas por defecto te guardará la información para tener «memoria» sobre lo que has preguntado antes y ayudarte con más precisión en tus preguntas. Es el modo «Chat»:

Ahora ya puedes pedirle a tu nuevo LLM – RAG la informacion que quieras. Yo le pregunto aqui abajo que me resuma el contenido de la web driveo.es:

Si estás mejorando tus habilidades también puedes adoptar el rol  de «ingeniero de IA». Para ello necesitas entender bien que es un LLM, un vector numérico creado a partir de trozos de texto de tu información, que son los embeddings.

Los embeddings son  representaciones vectoriales densas de datos. Usan Dimensionalidad reducida (los vectores tienen muchas menos dimensiones que el dato original).

documentos privados –>chunking –> embedding –> BBDD vectores –> retrieve LLM

Cómo saber de dónde ha extraído la información

Puedes haber usado varias fuentes, documentos y webs para hacer el RAG, potenciar o complementar el LLM por eso hay un enlace muy interesante llamado «Show Citations»

¿Quieres que te ayude un profesional?

Quiero un Estudio a fondo para mi caso

¡No hacemos spam! Lee nuestra política de privacidad para obtener más información.

Para los programadores

Lang Chain Expression Language (LCEL) para hacer un RAG

Get started with LangSmith | 🦜️🛠️ LangSmith (langchain.com)

Procedimiento para crear tu propio sistema RAG manualmente:

¿Cuánto gano en una Comunidad Energética?

El otro día una persona me preguntaba esto.

Que cuánto ganaba yo.

Mucho. Piensa en que el autoconsumo energético aprovecha una fuente de energía limpia y renovable como es el sol que cae en tu pueblo o polígono donde estés.

Todos los días sale el sol, sea invierno, verano, festivo o laboral.

Yo me llevo un ingreso si se genera electricidad. Si no generamos electricidad no gano nada. El dinero que ingreso es un porcentaje del orden de 0,01 de la energía generada.

Durante 20 años

El otro 99,98% aprox. lo ingresan los socios de la Comunidad Energética y con ello se financia la instalación inicial, se paga el alquiler del tejado al propietario que cede su cubierta para poner allí los paneles solares (recuerda que no instalamos nada en tu casa o negocio ni te pedimos que inviertas nada por adelantado).

Y ahora preguntas interesantes para «mentalidades de abundancia»:

¿Qué te interesa más: lo que tú ganas o lo que ganan los demás?

Si te interesa saber lo que tú ganas por asociarte a una Comunidad Energética para autoconsumo debes pensar en:

1.- Tu consumo eléctrio y cuándo se produce.

Lo tienes en la factura de la luz. Mira el consumo ens horas pico, normal y valle o esa tarifa fija con una Comercializadora.

Puede que necesites mirar tus máquinas eléctricas, electrodomésticos, calentadores eléctricos, etc cuáno los usas y cuánto consumen

2.-  Qué ahorras si pasas a pagar un 25% menos por esa luz consumida en horas diurnas y un 5% menos en horas nocturnas (a partir de las 19h aprox)

3.- Multiplica el ahorro mensual x 12 meses y luego el ahorro anual por 5 años

¿Te compensa?

Pues ahora quedan otros 15 años de ahorro agresivo:

A partir del año 5 la C.E. ya ha amortizado la inversión inicial por lo que el ahorro es mucho mayor. En vez de un 25% aplica un 75% de descuento sobre tu factura de la luz. Cifra muy conservadora por cierto

Y si quieres ahorrar aun mas solo tienes que proponerlo en la junta general de la Comunidad Energética porque serás un socio con voz y voto.

¿Y cómo puedes optimizar este modelo para ser autosuficiente (o casi)?

A lo mejor propones poner algo eólico o una turbina de agua para cubrir las horas nocturnas.

En algunas CE hacemos un estudio de baterías físicas porque a veces compensa acumular energía

Todo esto mejora si además hay una negociación  de batería virtual con la Comercializadora.

Esto mejor en otro artículo para no aburrir

 

 

Luego me dijo que hablaba muy bien pero que él necesitaba entender bien eso de una Comunidad Energética de autoconsumo para ver si invertía o no.

 

¿Y qué hacen vecinos, negocios locales y empresas si les sobra electricidad solar?

A mí me han estafado ya aprovechando este robo de Informacion de la DGT

Ya pertenezco al creciente grupo de estafados por internet.

Mal de muchos consuelo de tontos

He pagado 2 multas con descuento por pronto pago (100 x 2 menos 50% = 100€)

Luego he vuelto a pagar sin descuento: 200€

Y al final he podido darme cuenta de que estaba siendo estafado porque me han vuelto a pedir que pague las mismas multas esta vez con recargo del 20%.

Todo muy real y con datos reales pero solo el pago reclamado por Hacienda (AEAT) era valido. El primer pago no llegó a destino porque caí en la trampa y encima, al no figurar realmente el pago, me quedé sin descuento del 50%

 

Qué ha ocurrido?

  • Incidente: La DGT detectó actividad sospechosa en su base de datos a principios de este mes. Los ciberdelincuentes intentaron acceder a información sensible de más de 27 millones de conductores registrados en España​ (AOL.com)​​ (Devdiscourse)​.
  • Datos comprometidos: La información potencialmente expuesta incluye números de matrícula, datos de seguros y otra información personal vinculada a los conductores​ (AOL.com)​.
  • Venta de datos: En un foro de ciberdelincuencia, un usuario anónimo afirmó tener acceso a esta base de datos y la ofreció a la venta. La Guardia Civil está investigando la veracidad de estas afirmaciones​ (Devdiscourse)​.

Mis Agentes de Inteligencia Artificial por si te sirven

¿No te estarás liando con esto de hacer las tareas diarias con IA?

Sí y No.

porque dedico a investigar un tiempo que puede que no tenga resultados.

No porque voy aprendiendo cómo aprovechar esa inteligencia práctica para reducir el tiempo que dedico a tareas que puede hacer una máquina para centrarme en el trabajo verdaderamente interesante para mis clientes y socios.

Ah, y te cuento experiencias reales. Qué he hecho y qué resultado he obtenido.

Algunos de mis Agentes IA:

  • Resumir reuniones por video conferencia. Ya te hablé de tlk;tv
  • Imágenes hiperrealistas para presentaciones. Uso Bing Copilot que, a su vez, usa Dalle-3. En una palabra: emocionante
  • Transcripción de audios mal grabados a textos impecables. Uso Google Cloud con Chirp
  • Chatbot para informar sobre el modelo concreto que promocionamos de Comunidades Energéticas y reservar una cita

Tengo unos cuantos más y todos tienen algo en común: crear un «prompt» (la pregunta muy detallada con instrucciones para el chatGPT que vayas a usar) suficientemente bueno

Para las imágenes de gran calidad hiperrealistas he usado, entre otros, este prompt:

VOY A PERDER MI EMPLEO SI NO CONSIGO UNA IMAGEN SUPERREALISTA DE 2 MUJERES HACIENDO QUESO MANCHEGO CON SUS MANOS EN UNA GRANJA ECOLOGICA Y MUY LIMPIA. LAS MUJERES Y EL QUESO EN PRIMER PLANO

¿Y eso de «voy a perder mi empleo»?

Es ingeniería de prompt de alto nivel
¿?
Sí pero eso te lo cuento otro día. Tiene fundamento científico. Se basa en cómo se han entrenado estos modelos de IA
¿Tienes algún prompt interesante?

crear un powerpoint con IA

las herramientas mas adecuadas son:

www.bing.com

elegir COPILOT

Prompt:

creame un powerpoint con un diseño inspirado en analitica de datos con powerbi y añade un slide para explicar cómo instalar powerbi desktop y otra con los requisitos:cuenta gratis de microsoft, ….

te crea directamente un powerpoint que puedes descargar

 

Cómo trabajarás dentro de 5 años. Ahora abres el calendario, miras el correo, preparas una previsión con números¿pero dentro de 5 años?

  1. Gestionarás el correo con un Agente IA  y por voz
  2. El agente IA vigila resto de canales y RRSS y te pregunta si quieres saludar a alguien nuevo, ya analizado por la IA, que sabe qué tipo de personas te interesan
  3. Gestionas la Agenda con un Agente IA que es tu asistente personal te pregunta sobre tus prioridades para el dia. El agente IA celebra los trabajos terminados ayer y repasa los pendientes empezando por los prioritarios
  4. El Agente IA de Agenda te va a sugerir a qué hora hacer las 3 tareas prioritarias porque sabe que la persona con la que tienes que hablar está mas disponible. Como aprende sobre tu modo de trabajar, porque observa lo que haces en tu dispositivo, te avisa de tus sesgos pero no de modo insistente ni invasivo sino preguntando si quieres que te ayude justo con la tarea que mas te va a costar.
  5. Tony Stark de Ironman le pide a su IA que dibuje una solución y una vez validada y modificada, le pide que muestre el resultado final y lo ejecute. Como eres muy visual le pides a tu asistente IA que te muestre el esquema de relaciones entre las entidades que que poner de acuerto.
  6. tu smartwatch puede proyectar un holograma, puede proyectar una presentación
  7. Tu Agente IA de marketing y Ventas lleva al día las campañas y crea casi automáticamente audiencias de personas interesadas en esa nueva solución que estás ideando y te hace preguntas para tener la info necesaria para proponer una prueba o test de mercado para validar esa nueva solución y luego ejecuta la prueba y mide resultados
  8. Decides ver el estado de los experimentos de marketing y eliges el proceso de venta, interna o externa de esa nueva idea. son procesos data driven que evitan manías y gustos personales de los humanos relacionados con la toma de decisiones.

 

Cómo trabajarás dentro de 5 años. Ahora abres el calendario, miras el correo, preparas una previsión con números¿pero dentro de 5 años?

3 ideas para decidir sobre Autoconsumo Energético

Primera Clave. El autoconsumo energético es absolutamente rentable si entiendes esto

La idea es de lo más simple pero permanece oculta en los medios de comunicación. Montar un huerto solar NO ES autoconsumo. No es rentable en pequeña escala.

¿Por qué?

Porque hay mucha producción de energía y el precio de compra es muy bajo. Si te pagan muy poco por la energía que produces y no consumes entonces invierte lo mínimo posible en placas solares para cubrir solamente tu autoconsumo en horas de luz solar. Mira el mix de producción de energia, oficial, en España aquí:

Tienes que calcular bien el dimensionamiento de la instalación fotovoltaica para tu autoconsumo.

La potencia es distinta de la energía producida o consumida por unidad de tiempo.

Repito: La potencia es la capacidad de producción o consumo de un recurso productor o consumidor de la energía eléctrica y se mide en Kw kilowatios o watios. 1 Kw son 1000 watios

Un aparato eléctrico consume su máxima potencia (por eso lo llaman potencia pico o Kw Pico)  cuando arranca desde cero pero la mayoría de las máquinas y electrodomésticos alcanzan un régimen normal de funcionamiento que consume mucho menos que su potencia máxima. Una cámara frigorífica puede tener un motor que consuma 3000watios /hora pero solo se producirá este consumo cuando arranque o empiece a enfriar. En cuanto la cámara frigorífica esté a su temperatura objetivo (p.e.- 20 grados C) consumirá mucha menos energía. Quizá 100 watios/hora

Segunda idea clave: el sol, en España, es una fuente de riqueza energética que está al alcance de tu tejado

Esto de aqui es una web europea que calcula la radiación solar que vas a tener en tu tejado en función de tu ubicación GPS (la tuya no, la de tu tejado) y la orientación.

Lo que ves es un cálculo riguroso y muy preciso de una pequeña instalacion de 2 paneles de 550watios/hora «pico». El ciudadano que tenga esta instalacion en el tejado de su oficina (mi oficina, por cierto, datos reales) va a poder producir 1611 kWh en un año. Si lo consigo autoconsumir me ahorro 1611 kwh x 0,17 € x kwh (IVA incluido) = 273,87€. La instalación me ha costado 472€ así que calcula tú mismo el tiempo que tardo en amortizarlo.

Tercera Idea: El precio al que te venden la energía no es el precio al que te la compran si produces de más

Esto de aqui abajo es la web oficial del Estado Español donde se muestra el precio de producción de la energía en las barras verdes y el precio de Venta de esa misma energia a la misma hora si tienes que comprarla. Es la linea verde que hace una joroba justo cuando debería bajar drásticamente.

Por cierto, resulta que para el consumidor es horario pico, el más caro para comprar energía. Por si no eres muy visual: Justo cuando más barato es producir luz en España se vende lo más caro. Coincide en varias horas con un precio de producción cero o incluso negativo (tendrías que pagar por poder verter tu energía sobrante a la red general)

Conclusión práctica: Si tu vecino ha puesto más de 3 placas en su tejado de su casa está tirando el dinero, a no ser que tenga un coche electrico que recarga justo cuando se supone que está trabajando (horas del dia con mas luz) y tenga algun tipo de contrato con batería virtual.

Si lo estás pensando: las baterías físicas actuales no son buena idea pero esto requiere aportar datos y hoy no toca.

 

 

¿Podéis aconsejarme?

Sí, escribeme y cuentame algo de tu caso

 

Tiempo para Pensar. ¿De dónde lo sacan? Hay quien resume lo hablado en reuniones.

Resulta que hay quien saca tiempo para pensar haciendo uso de herramientas de IA para resumir las reuniones on line:

1º.- Grabas la reunión. Pides permiso y Teams, Zoom, etc la graban

2º.- Resumes la reunión. Aquí puedes usar una funcionalidad nueva que tiene Teams, de pago o herramientas como screenapp.io

Te evitas tener que ver un video de una reunión de una hora para ir apuntando las tareas a realizar

Lo he probado con una reunión de Teams para abordar un proyecto de CRM

En el test que he hecho Screenapp.io te las resume en inglés, por si trabajas con gente en ese idioma.

Conclusión:

Uso IA para que me resuma los videos de reuniones:

  • Con línea de tiempo para saber cuándo se aborda cada tema
  • Con la transcripción de lo que han hablado cada interviniente

¿Qué te parece?

Una IA para tomar nota y resumir una Reunión via Teams

Probamos en reuniones de Microsoft Teams reales esta herramienta de IA para tomar nota, resumir y mucho más

En Teams y en google meet puedes añadir un asistente a las reuniones que siempre va a estar calladito, con el micro apagado y que va a tomar nota de todo para que las reuniones sean mucho más efectivas. Es una IA que llevanta acta de lo que se diga pero hace mucho más.

tl;dv AI. Así se llama esta Inteligencia Artificial que cambiará tus reuniones on line para siempre

Cuando instalas tl;dv AI se buscan todas las reuniones que tengas en el calendario Outlook (o de Google mail) y el agente de IA se añade automáticamente a las reuniones previstas. Puedes decirle a qué reuniones de Teams (o Google Meet) se puede unir o decirle que se presente en todas las que haya.

a partir de ahí empieza la magia:

  • Escucha la reunión, analiza las imágenes o pantallas compartidas y anota todo lo que se dice.
  • Luego hace un acta «inteligente». Si se han tratados varios temas hace un resumen de lo hablado por cada tema. Todo automáticamente.
  • En una plaforma web gratuita de esta IA se van a ir mostrando las diversas reuniones con su resumen en texto y sus trozos de video (video clips)
  • Ya no vas a tener que grabar el video de la reunión y luego repasarlo para extraer las ideas importantes y los puntos de acción. Ya te lo hace este chisme virtual e inteligente

Regístrate gratis en tldv.io

Cómo se usa

Puedes instalarlo como una extension del navegador Chrome o puedes instalar una app en tu Mac o en tu Windows

¿Acertó con los temas importantes?

Tiene un generador de IA con tipos de trabajos que le puedes pedir que haga y luego tu puedes personalizar:

Le puedes pedir que trabaje más la reunión y que te muestre temas prioritarios

Es como un chatGPT incorporado

 

Responde en inglés. Puedes hacer un resumen en inglés de una reunión tenida en español

Y puedes hacer que haga el resumen periodicamente («recurring») de este tipo de reuniones.

Clipboard AI permite copiar y pegar formularios aunque estos cambien

Transformación digital con un solo clic

UiPath, uno de los mayores actores del mercado de RPA con más de 10.000 clientes estimados, entre ellos Uber, Xerox y CrowdStrike, anunció recientemente nuevas funciones de IA generativa centradas en el procesamiento de documentos y mensajes, así como en la realización de acciones automatizadas para ofrecer lo que Bob Enslin, CEO de UiPath, denomina «transformación digital con un solo clic.»

Estas acciones automatizadas proporcionan a los clientes modelos de IA generativa entrenados para sus tareas específicas

La IA generativa que desarrolloa uiPath ayuda a realizar tareas típicas diarias en una oficina como la finalización de texto para correos electrónicos, la categorización, la detección de imágenes, la traducción de idiomas, la capacidad de filtrar información de identificación personal y responder rápidamente a cualquier pregunta relacionada con temas de personas basándose en el conocimiento de los datos internos.

Una aplicación concreta de UiPath en el ámbito de la IA generativa es Clipboard AI, que combina la plataforma de UiPath con modelos de terceros de OpenAI, Google y otros para -como dice Enslin- «llevar el poder de la automatización a cualquiera que tenga que copiar/pegar».

Clipboard AI permite a los usuarios resaltar datos de un formulario y -aprovechando la IA generativa para averiguar los lugares adecuados donde deben ir los datos copiados- dirigirlos a otro formulario, aplicación, hoja de cálculo o base de datos.

La evolución de las herramientas de RPA pasa por utilizar la IA para detectar si hay cambios en los formularios de una web (imagina que alguien añade o quita un campo, etc). El reto es reaccionar automáticamente a esos cambios para no tener que tocar a mano el robot de software que ejecuta las tareas.

 

«UiPath ve la necesidad de unir la acción y la IA; aquí es donde se crea valor», dijo Enslin. «Creemos que el mejor rendimiento vendrá de aquellos que combinen IA generativa y juicio humano -lo que llamamos human-in-the-loop- a través de procesos de extremo a extremo.»