ಟ್ರೆಂಡಿಂಗ್

ಇಂಡಿಕ್ ಎಐ ತಂತ್ರಜ್ಞಾನ: ಭಾಷೆಯ ಹಂಗಿಲ್ಲದ ಭಾರತ!

ಇಂಡಿಕ್ ಎಐ ತಂತ್ರಜ್ಞಾನ: ಭಾಷೆಯ ಹಂಗಿಲ್ಲದ ಭಾರತ!

ನಾವು 2026ರ ಹೊಸ್ತಿಲಲ್ಲಿ ನಿಂತು ತಂತ್ರಜ್ಞಾನದ ಜಗತ್ತನ್ನು ಒಮ್ಮೆ ಅವಲೋಕಿಸಿದರೆ, ಕಳೆದ ಎರಡು ವರ್ಷಗಳು ಭಾರತೀಯ ಡಿಜಿಟಲ್ ಇತಿಹಾಸದಲ್ಲಿ ಸುವರ್ಣಾಕ್ಷರಗಳಲ್ಲಿ ಬರೆದಿಡುವಂತಹ ಕಾಲಘಟ್ಟವಾಗಿ ಮಾರ್ಪಟ್ಟಿವೆ. ಇಲ್ಲಿಯವರೆಗೆ ಆರ್ಟಿಫಿಷಿಯಲ್ ಇಂಟೆಲಿಜೆನ್ಸ್ ಅಥವಾ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಎಂದರೆ ಅದು ಕೇವಲ ಇಂಗ್ಲಿಷ್ ಬಲ್ಲವರ ಸ್ವತ್ತಾಗಿತ್ತು. ಪಾಶ್ಚಿಮಾತ್ಯರ ಡೇಟಾಸೆಟ್‌ಗಳ ಮೇಲೆ ತರಬೇತಿ ಪಡೆದ ಮಾಡೆಲ್‌ಗಳು ನಮ್ಮ ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ಹೆಣಗಾಡುತ್ತಿದ್ದವು. ನಮಸ್ಕಾರ ಎಂದರೆ ಹಲೋ ಎಂದು ಯಾಂತ್ರಿಕವಾಗಿ ತರ್ಜುಮೆ ಮಾಡುವ ಬದಲು, ಆ ಪದದ ಹಿಂದಿನ ಭಾವನೆಯನ್ನು ಗ್ರಹಿಸುವ ಹಂತಕ್ಕೆ ಇಂದು ನಮ್ಮದೇ ಆದ ಇಂಡಿಕ್ ಎಐ ತಂತ್ರಜ್ಞಾನ ಬೆಳೆದಿದೆ. 

ಈ ಬದಲಾವಣೆಯ ಮುಂಚೂಣಿಯಲ್ಲಿ ನಿಂತಿರುವುದು ಐಐಟಿ ಮದ್ರಾಸ್‌ನ ಎಐ4ಭಾರತ್ (AI4Bharat) ತಂಡ. ಇದನ್ನು ಕೇವಲ ಒಂದು ಸಂಶೋಧನಾ ಕೇಂದ್ರ ಎನ್ನುವ ಬದಲು ಇಂಡಿಕ್ ಎಐ ಜಗತ್ತಿನ ಬೆನ್ನೆಲುಬು ಎನ್ನಬಹುದು. ತಾಂತ್ರಿಕವಾಗಿ ಹೇಳುವುದಾದರೆ, ಇಂಗ್ಲಿಷ್ ಭಾಷೆಗೆ ಹೋಲಿಸಿದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳು ವಿಭಿನ್ನ. ನಮ್ಮಲ್ಲಿ ಸಂಧಿಸಮಾಸಗಳಿವೆ ಮತ್ತು ಪದಗಳು ಒಂದಕ್ಕೊಂದು ಕೂಡಿಕೊಂಡಿರುತ್ತವೆ. ಹಳೆಯ ಮಾಡೆಲ್‌ಗಳು ಕನ್ನಡದ ಒಂದು ಪದವನ್ನು ಅರ್ಥಹೀನವಾಗಿ ಒಡೆಯುತ್ತಿದ್ದವು. ಆದರೆ ಎಐ4ಭಾರತ್ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ ಇಂಡಿಕ್‌ಬರ್ಟ್ (IndicBERT) ಮತ್ತು ಇಂಡಿಕ್‌ಟ್ರಾನ್ಸ್‌2 (IndicTrans2) ಮಾಡೆಲ್‌ಗಳು ನಮ್ಮ ವ್ಯಾಕರಣದ ಜಟಿಲತೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವಲ್ಲಿ ಯಶಸ್ವಿಯಾಗಿವೆ. ಇದಕ್ಕಾಗಿ ಅವರು ರೂಪಿಸಿದ ಸಂಗ್ರಹ (Sangraha) ಎಂಬ ಬೃಹತ್ ಡೇಟಾಸೆಟ್, ಸುಮಾರು 22 ಭಾಷೆಗಳ 251 ಬಿಲಿಯನ್ ಟೋಕನ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿದ್ದು, ಭವಿಷ್ಯದ ಡೆವಲಪರ್‌ಗಳಿಗೆ ಭದ್ರ ಬುನಾದಿ ಹಾಕಿಕೊಟ್ಟಿದೆ.

ಸರ್ಕಾರದ ಕಡೆಯಿಂದ ಭಾಷಿಣಿ (Bhashini) ಯೋಜನೆಯು ಯುಪಿಐ ಮಾದರಿಯಲ್ಲಿ ಒಂದು ಡಿಜಿಟಲ್ ಪಬ್ಲಿಕ್ ಇನ್ಫ್ರಾಸ್ಟ್ರಕ್ಚರ್ ಆಗಿ ಹೊರಹೊಮ್ಮಿದೆ. ಭಾಷೆಯ ಕಾರಣದಿಂದ ಯಾರೊಬ್ಬರೂ ಡಿಜಿಟಲ್ ಸೇವೆಯಿಂದ ವಂಚಿತರಾಗಬಾರದು ಎಂಬುದೇ ಇದರ ಮೂಲ ಉದ್ದೇಶ. ಇದರ ಯುನಿವರ್ಸಲ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಕಾಂಟ್ರಿಬ್ಯೂಷನ್ ಎಪಿಐ (ULCA) ಬಳಸಿಕೊಂಡು, ಇಂದು ಸ್ಟಾರ್ಟಪ್‌ಗಳು ರೈತರಿಗಾಗಿ ಮತ್ತು ಗ್ರಾಮೀಣ ಜನರಿಗಾಗಿ ಧ್ವನಿ ಆಧಾರಿತ ಬಾಟ್‌ಗಳನ್ನು ರೂಪಿಸುತ್ತಿವೆ. ಭಾಷಾ ದಾನ ಎಂಬ ಅಭಿಯಾನದ ಮೂಲಕ ಲಕ್ಷಾಂತರ ಜನರು ತಮ್ಮ ಧ್ವನಿಯನ್ನು ಇದಕ್ಕೆ ನೀಡುತ್ತಿದ್ದಾರೆ, ಇದರಿಂದ ಎಐಗೆ ನಮ್ಮ ಪ್ರಾದೇಶಿಕ ಸೊಗಡು ಮತ್ತು ಉಚ್ಚಾರಣೆ ಸ್ಪಷ್ಟವಾಗಿ ಅರ್ಥವಾಗುತ್ತಿದೆ.

ಜಗತ್ತು ಬೃಹತ್ ಮಾಡೆಲ್‌ಗಳತ್ತ ಓಡುತ್ತಿದ್ದರೆ, ಬೆಂಗಳೂರು ಮೂಲದ ಸರ್ವಂ ಎಐ (Sarvam AI) ತಂಡವು ಸ್ಮಾಲ್ ಲಾಂಗ್ವೇಜ್ ಮಾಡೆಲ್ (SLM) ಕ್ರಾಂತಿಯನ್ನು ಹುಟ್ಟುಹಾಕಿದೆ. ಭಾರತದಂತಹ ದೇಶದಲ್ಲಿ ಎಲ್ಲರ ಬಳಿ ದುಬಾರಿ ಜಿಪಿಯು ಅಥವಾ ಹೈ-ಎಂಡ್ ಸರ್ವರ್‌ಗಳು ಇರುವುದಿಲ್ಲ. ಹಾಗಾಗಿ ಅವರು ಸರ್ವಂ-1 ರಂತಹ 2 ಬಿಲಿಯನ್ ಪ್ಯಾರಾಮೀಟರ್ ಉಳ್ಳ ಚಿಕ್ಕ ಮಾಡೆಲ್ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದ್ದಾರೆ. ಇದು ಕಡಿಮೆ ಸಂಪನ್ಮೂಲದಲ್ಲೇ ಅತ್ಯಂತ ವೇಗವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಮತ್ತು 10 ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಜಾಗತಿಕ ಮಾಡೆಲ್‌ಗಳಿಗೆ ಸೆಡ್ಡು ಹೊಡೆಯುವ ಸಾಮರ್ಥ್ಯ ಹೊಂದಿದೆ. ಇದರಿಂದಾಗಿ ಮೊಬೈಲ್ ಫೋನ್‌ಗಳಲ್ಲೇ ಇಂಟರ್ನೆಟ್ ಇಲ್ಲದೆಯೂ ಎಐ ಸೇವೆ ನೀಡಲು ಸಾಧ್ಯವಾಗುತ್ತಿದೆ.

ಈ ಎಲ್ಲಾ ಬೆಳವಣಿಗೆಗಳ ಹಿಂದೆ ಕೇವಲ ದೊಡ್ಡ ಕಂಪನಿಗಳಿಲ್ಲ, ಬದಲಿಗೆ ಗಿಟ್‌ಹಬ್ ಮತ್ತು ಎಕ್ಸ್ (ಟ್ವಿಟರ್)ಗಳಲ್ಲಿ ಸಕ್ರಿಯವಾಗಿರುವ ಸಾವಿರಾರು ಸ್ವತಂತ್ರ ಡೆವಲಪರ್‌ಗಳ ಪಾತ್ರ ಹಿರಿದು. ಇವರು ಜಾಗತಿಕವಾಗಿ ಲಭ್ಯವಿರುವ ಲಾಮಾ-3 ರಂತಹ ಮಾಡೆಲ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡು, ಅದಕ್ಕೆ ಕನ್ನಡದ ಸಾಹಿತ್ಯ ಮತ್ತು ಪತ್ರಿಕೆಗಳ ಡೇಟಾ ಉಣಿಸಿ ಫೈನ್-ಟ್ಯೂನ್ ಮಾಡುತ್ತಿದ್ದಾರೆ. ಹಳೆಯ ಕನ್ನಡದ ಪುಸ್ತಕಗಳನ್ನು ಡಿಜಿಟೈಸ್ ಮಾಡಲು ಬೇಕಾದ ಒಸಿಆರ್ (OCR) ತಂತ್ರಜ್ಞಾನದಲ್ಲಿಯೂ ಅದ್ಭುತ ಸುಧಾರಣೆಯಾಗಿದೆ. ಡೀಪ್‌ಸೀಕ್ ಅಥವಾ ಟೆಸ್ಸಿರಾಕ್ಟ್ ನಂತಹ ಎಂಜಿನ್‌ಗಳನ್ನು ನಮ್ಮ ಲಿಪಿಗಳಿಗೆ ತಕ್ಕಂತೆ ಮಾರ್ಪಡಿಸಲಾಗುತ್ತಿದೆ.

ಭವಿಷ್ಯವು ವಾಯ್ಸ್-ಫರ್ಸ್ಟ್ ಇಂಟರ್ನೆಟ್ ಕಡೆಗೆ ಸಾಗುತ್ತಿದೆ. ಟೈಪ್ ಮಾಡಿ ಹುಡುಕುವ ಬದಲು, ಮಾತನಾಡಿ ಮಾಹಿತಿ ಪಡೆಯುವ ಯುಗ ಇದು. ಶಿಕ್ಷಣದಲ್ಲಿ ಸಂಕೀರ್ಣ ವಿಜ್ಞಾನ ವಿಷಯಗಳನ್ನು ಸರಳ ಕನ್ನಡದಲ್ಲಿ ವಿವರಿಸುವ ಎಐ ಶಿಕ್ಷಕರಿಂದ ಹಿಡಿದು, ನ್ಯಾಯಾಂಗದ ಸಾವಿರಾರು ಪುಟಗಳ ತೀರ್ಪುಗಳನ್ನು ಪ್ರಾದೇಶಿಕ ಭಾಷೆಗಳಿಗೆ ಅನುವಾದಿಸುವವರೆಗೆ ಎಐ ವ್ಯಾಪಿಸಿದೆ. ತಂತ್ರಜ್ಞಾನಕ್ಕಾಗಿ ನಾವು ಭಾಷೆ ಕಲಿಯುವ ಅಗತ್ಯವಿಲ್ಲ, ನಮ್ಮ ಭಾಷೆಯನ್ನೇ ತಂತ್ರಜ್ಞಾನ ಕಲಿಯುವಂತೆ ಮಾಡುವಲ್ಲಿ ನಾವು ಯಶಸ್ವಿಯಾಗಿದ್ದೇವೆ. ಇದು ನಿಜವಾದ ಅರ್ಥದಲ್ಲಿ ತಂತ್ರಜ್ಞಾನದ ಪ್ರಜಾಪ್ರಭುತ್ವೀಕರಣವಾಗಿದೆ.

Chaitrika Vaidya
Chaitrika Vaidya
Script Writer. Co - editor of Tech Vaidya
106

0 ಕಾಮೆಂಟ್‌ಗಳು

ಇನ್ನೂ ಯಾವುದೇ ಕಾಮೆಂಟ್‌ಗಳಿಲ್ಲ.

ಕಾಮೆಂಟ್ ಮಾಡಿ

ಚಂದಾದಾರರಾಗಿ

ಬ್ರೇಕಿಂಗ್‌ ನ್ಯೂಸ್, ಟ್ರೆಂಡಿಂಗ್ ಸ್ಟೋರಿ ಆಳವಾದ ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ನಿರಂತರವಾಗಿ ಪಡೆಯಲು ಉಚಿತವಾಗಿ ಚಂದಾದಾರರಾಗಿ.

Follow Us
ಜಾಹೀರಾತು

ಸಂಬಂಧಿತ ಸುದ್ದಿ

ಚಂದಾದಾರರಾಗಿ

ಬ್ರೇಕಿಂಗ್‌ ನ್ಯೂಸ್, ಟ್ರೆಂಡಿಂಗ್ ಸ್ಟೋರಿ ಆಳವಾದ ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ನಿರಂತರವಾಗಿ ಪಡೆಯಲು ಉಚಿತವಾಗಿ ಚಂದಾದಾರರಾಗಿ.