Add to Cart

Bert-grande inférence | Unité centrale de traitement seulement : Or de Xeon 6240 @ 2,60 gigahertz, précision = FP32, taille en lots = 128 | V100 : NVIDIA TensorRT™ (TRT) 7,2, précision = INT8, taille en lots = 256 | A100 40GB et 80GB, taille en lots = 256, précision = INT8.
MLPerf 0,7 RNN-T a mesuré avec (tranches 1/7) de MIG. Cadre : TensorRT 7,2, ensemble de données = LibriSpeech, précision = FP16.
Processus d'ordre
| Ajoutez les pièces à la forme de RFQ | Soumettez le RFQ | Nous répondons d'ici 24 heures |
| Vous confirmez l'ordre | Paiement | Bateau votre ordre |






