Accueil > Activités > Projets R&D > TIMCO

Projets R&D

 

TIMCO
Technologie pour « in-memory computing »

 
 

Porteur : Bull SAS
Appel à projet : FUI 13
Statut : en cours
Groupes Thématiques de SYSTEMATIC : OCDS
Date de début du projet : Juin 2012
Date de fin de projet : Mai 2015
Durée : 3 ans
Montant total : 9,5M€
Montant aide : 3,75M€

Partenaires du projet : ARMADILLO – BULL – CEA – DISTENE – ESILV – HSW – INRIA/TAO – IP/LABEL

 
 

Mise à jour : decembre 2014

Ce projet coopératif a pour but :

  • non seulement de construire un « Serveur Nœud très grande mémoire » incluant le design d'un circuit intégré permettant d’assurer la cohérence de la mémoire de huit serveurs rassemblant 16 processeurs. L’objectif est d’obtenir une taille mémoire adressable de 24 TB (état de l’art initial 4 TB), dédiée au traitement de données massives « in-memory computing ».

  • mais aussi de bénéficier de cette avancée quantitative pour mener une rupture qualitative sur des Applications de Business Intelligence & Services Management, Industrielles et Scientifiques :

    • Algorithmes dédiés au big-data mining (INRIA, ESILV)
    • SGBD NoSQL sémantique de grande dimension (Armadillo)
    • Génération de très grands maillages (Distene)
    • Application de génomique (CEA-IG)
    • Traitement de grand corpus de données. (Horizon Software, IP-Label)

L’année 2014 a été focalisée sur les développements et premiers tests.

Bull a terminé le design de son chip d’interconnexion de cohérence mémoire et la validation de son nouveau serveur, qui offre la possibilité pour un unique OS d’utiliser 240 cœurs et 24 To de mémoires. Ce serveur est commercialisé sous le nom de gamme « Bullion S » et rencontre déjà un joli succès commercial. Evidemment, un serveur de cette gamme a été mis à disponibilité des partenaires du projet et leur permet de tester et valider leurs développements software.

En effet, Armadillo associé à l’INRIA et ESILV ont avancé sur l’évolution de leurs modèles et le support de SparQL. Comme Horizontal Software, ils ont terminé le portage de leurs logiciels sur Linux. Horizon Software a implémenté ses nouveaux modèles de contraintes et solvers qui doivent permettre des gains de performances. Distene a terminé le portage de son code d’outil de maillage basé sur la parallélisation des tâches via MPI vers un code mono-process multi-threadé. Les premiers tests sur le nouveau serveur sont très encourageant. Le CEA-IG, a fini ses développements et lancera ses tests sur la nouvelle machine dès le début 2015. Armadillo et IP-Label ont avancé leurs travaux sur l’implémentation du concept de « Cube » pour stocker les données et permettre des requêtes optimisées.

L’année 2015 sera donc plus consacrée à la finalisation des tests et benchs pour valider les gains obtenus.
De plus, l’INRIA a soumis avec l’aide d’une société tiers,  un outil  de « Tests For TripleStore » (SPARQLScore) au  Semantic Web Challenge, qui a été accepté.

La plupart des partenaires ont déjà bénéficié du retour sur investissement des études réalisées à travers le projet TIMCO. Soit par de nouveaux produits ou services ajoutés à leur catalogue, soit par l’amélioration de performance ou de scalabilité de leurs outils, leur ouvrant ainsi les portes de nouveaux clients. 

 
 

Mise à jour : Janvier 2014

Objet du projet

Concevoir un circuit intégré :

    - pour un serveur ayant jusqu’à 8 modules rassemblant 16 processeurs
    - permettant d’assurer la cohérence de la mémoire de ces huit modules.
    - Objectif : 24 TeraBytes (état de l’art 4 TB), permettant le « in-memory computing ».

Bénéficier de cette avancée quantitative pour mener une rupture qualitative sur des Applications de Business Intelligence & Services Management, Industrielles et Scientifiques:

- Algorithmes dédiés au big-data mining
- SGBD NoSQL sémantique de grande dimension
- Génération de très grands maillages
- Application de génomique
- Traitement de grand corpus de données

Résultats attendus

Un prototype d’architecture de référence, maquette du futur serveur grande mémoire, ouverte à l’ensemble des partenaires du projet

- Design d’un nouveau circuit intégré (40 nanomètres) permettant de construire des systèmes allant jusqu'à 16 sockets ;
- Environnement de vérification du circuit intégré ;
- Prototype d’architecture de référence (permettant de faire passer la taille mémoire adressable de 4 TB à 24 TB) ;
- Outils d’exploitation et d’optimisation.

Un panel de logiciels optimisés au niveau des méthodes et algorithmes (couches basses)

- Optimisation des index B-tree pour les SGBD ; bases de données NoSQL (Armadillo, Ip-label) ;
- Algorithmes d’optimisation et d'apprentissage (INRIA) ;
- Algorithmes de génération de maillage (Distene) ;
- Machine Virtuelle d’Inférence et d’Associativité (ESILV) ;
- Analyse de séquences génomiques: recherches dans de grands graphes (CEA) ;
- Algorithme de parallélisation de la recherche de la solution optimale d’un problème de planification de ressources (HSW).

Un ensemble d’applicatifs mettant à profit ces algorithmes au niveau des usages

- Data store, traitement et indexation de gros volumes de données SGBD NoSQL (Armadillo, Ip-label, INRIA, ESILV) ;
- Application Tara océans: Analyse de données issus d’échantillons métagénomiques marins (CEA, Bull) ;
- Application aux grands maillages : benchmark sur génération de maillages tétraédriques ou hexaédriques (Distene, INRIA) ;
- Exploitation et validation de grands graphes sémantiques (ESILV, Armadillo) ;
- Simulation numérique du comportement magnéto-élastique des matériaux ferromagnétiques (ESILV) ;
- Optimisation de planning des ressources humaines et matérielles des entreprises (HSW).

 

 

 

 
© TERATEC - Tous droits réservés - Mentions légales