Deux nouveaux ensembles de données viennent d'être Goutte pour quiconque construit à grande échelle. La collection Nemotron-ClimbLab contient 1,2 trillion de tokens—conçue spécifiquement pour un entraînement efficace de modèles à grande échelle. Les deux ensembles de données sont maintenant disponibles publiquement pour les développeurs et les chercheurs travaillant sur l'infrastructure IA de nouvelle génération. Ce type de publication open-source pourrait sérieusement abaisser la barrière pour les équipes essayant d'entraîner des modèles lourds sans épuiser leurs budgets de calcul.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
1,2 trillion tokens ? Cela va permettre d'économiser un peu sur les cartes graphiques.
Voir l'originalRépondre0
MentalWealthHarvester
· Il y a 17h
1,2 trillion tokens ? Mon dieu, maintenant les petites équipes peuvent aussi jouer avec de grands modèles, sans être écrasées par le coût de la puissance de calcul.
Voir l'originalRépondre0
AirdropDreamBreaker
· Il y a 17h
1,2 trillion tokens ? Cela va permettre de dépenser moins d'argent en cartes graphiques, enfin un Open Source avec du bon sens.
Deux nouveaux ensembles de données viennent d'être Goutte pour quiconque construit à grande échelle. La collection Nemotron-ClimbLab contient 1,2 trillion de tokens—conçue spécifiquement pour un entraînement efficace de modèles à grande échelle. Les deux ensembles de données sont maintenant disponibles publiquement pour les développeurs et les chercheurs travaillant sur l'infrastructure IA de nouvelle génération. Ce type de publication open-source pourrait sérieusement abaisser la barrière pour les équipes essayant d'entraîner des modèles lourds sans épuiser leurs budgets de calcul.