गहरी शिक्षा वैज्ञानिक सुपरकंप्यूटर तक फैली हुई है

INDIA's first supercomputer (जून 2019).

Anonim

मशीन लर्निंग, कृत्रिम बुद्धि का एक रूप, वाणिज्यिक अनुप्रयोगों में अभूतपूर्व सफलता का आनंद लेता है। हालांकि, विज्ञान के लिए उच्च प्रदर्शन कंप्यूटिंग में मशीन सीखने का उपयोग सीमित कर दिया गया है। क्यूं कर? उन्नत मशीन लर्निंग टूल्स को बड़े डेटा सेट के लिए डिज़ाइन नहीं किया गया था, जैसे सितारों और ग्रहों का अध्ययन करने के लिए उपयोग किया जाता था। इंटेल, नेशनल एनर्जी रिसर्च वैज्ञानिक कंप्यूटिंग सेंटर (एनईआरसीसी) और स्टैनफोर्ड की एक टीम ने उस स्थिति को बदल दिया। उन्होंने पहले 15-पेटाफ्लोप गहरे सीखने वाले सॉफ्टवेयर विकसित किए। उन्होंने कोरी सुपरकंप्यूटर पर टेस्ट रन के माध्यम से बड़े डेटा सेट को संभालने की अपनी क्षमता का प्रदर्शन किया।

सुपरकंप्यूटर पर मशीन लर्निंग तकनीकों का उपयोग करके, वैज्ञानिक बड़े, जटिल डेटा सेट से अंतर्दृष्टि निकाल सकते हैं। शक्तिशाली उपकरण, जैसे त्वरक, बड़े पैमाने पर डेटा सेट का उत्पादन करते हैं। नया सॉफ्टवेयर दुनिया के सबसे बड़े सुपरकंप्यूटर को ऐसे डेटा को गहरे सीखने के उपयोग में फिट करने में सक्षम बना सकता है। परिणामी अंतर्दृष्टि पृथ्वी प्रणाली मॉडलिंग, संलयन ऊर्जा, और खगोल भौतिकी का लाभ उठा सकती है।

मशीन सीखने की तकनीकें वैज्ञानिकों को त्वरक, प्रकाश स्रोत, टेलीस्कोप, और कंप्यूटर सिमुलेशन द्वारा उत्पादित बड़े, जटिल डेटा सेटों से मूल्यवान अंतर्दृष्टि निकालने के लिए सक्षम बनाती हैं। हालांकि इन तकनीकों को विभिन्न प्रकार के वाणिज्यिक अनुप्रयोगों में बड़ी सफलता मिली है, लेकिन विज्ञान के लिए उच्च प्रदर्शन कंप्यूटिंग में उनका उपयोग सीमित कर दिया गया है क्योंकि मौजूदा उपकरण टेराबाइट के साथ काम करने के लिए डिज़ाइन नहीं किए गए थे- कई विज्ञान डोमेन में पाए जाने वाले पेटबाइट आकार के डेटा सेटों के लिए।

इस समस्या को हल करने के लिए इंटेल, नेशनल एनर्जी रिसर्च वैज्ञानिक कंप्यूटिंग सेंटर और स्टैनफोर्ड विश्वविद्यालय के बीच एक सहयोग, गहरी सीखने की तकनीक, मशीन सीखने का एक रूप, टेराबाइट और पेटबाइट डेटा सेट पर उपयोग करते समय उत्पन्न होने वाली समस्याओं को हल करने के लिए काम कर रहा है। टीम ने पहले 15-पेटाफ्लोप गहरे सीखने वाले सॉफ्टवेयर विकसित किए। उन्होंने बड़े वैज्ञानिक डेटा सेट का उपयोग करके कई प्रशिक्षण रनों को निष्पादित करके डेटा-गहन अनुप्रयोगों के लिए अपनी स्केलेबिलिटी का प्रदर्शन किया। रनों ने भौतिकी का उपयोग किया- और राष्ट्रीय ऊर्जा अनुसंधान वैज्ञानिक कंप्यूटिंग सेंटर में स्थित एक सुपरकंप्यूटर कोरी पर जलवायु आधारित डेटा सेट। उन्होंने 11.73 और 15.07 पेटाफ्लॉप (सिंगल-प्रेसिजन) और 11.41 से 13.47 पेटाफ्लॉप के औसत निरंतर प्रदर्शन के बीच एक शीर्ष दर हासिल की। (एक petaflop प्रति सेकंड लाख अरब गणना है।)

menu
menu