[ad_1]
- OpenAI, Meta, Google మరియు ఇతర పెద్ద టెక్ కంపెనీలు తమ AI మోడల్లకు శిక్షణ ఇవ్వడానికి ఆన్లైన్ డేటాను ఉపయోగిస్తాయి.
- అయినప్పటికీ, AI మోడల్లు చాలా త్వరగా నేర్చుకుంటాయి, 2026 నాటికి మొత్తం డేటా అయిపోతుంది.
- కాబట్టి AI సిస్టమ్లు నేర్చుకోవడం ఎలా కొనసాగుతుంది?బిగ్ టెక్ కొన్ని ఆసక్తికరమైన ఆలోచనలను కలిగి ఉంది.
AI విషయానికి వస్తే, మరింత మంచిది. AI సిస్టమ్ ఎంత ఎక్కువ డేటాపై శిక్షణ పొందితే, అది మరింత శక్తివంతంగా మారుతుంది.
కానీ AI ఆయుధ పోటీ తీవ్రతరం కావడంతో, Meta, Google మరియు OpenAI వంటి పెద్ద టెక్ కంపెనీలు తమ మోడల్లకు శిక్షణ ఇవ్వడానికి డేటా కొరతను ఎదుర్కొంటున్నాయి.
అనేక ప్రధాన AI వ్యవస్థలు ఆన్లైన్ డేటా యొక్క విస్తారమైన సరఫరాపై శిక్షణ పొందాయి. AI పరిశోధనా సంస్థ ఎపోచ్ ప్రకారం, అన్ని అధిక-నాణ్యత డేటా 2026 నాటికి ఉపయోగించబడవచ్చు.
ఫలితంగా, ప్రముఖ సాంకేతిక సంస్థలు తమ సిస్టమ్లను నేర్చుకోవడం కొనసాగించడానికి కొత్త డేటా వనరుల కోసం వెతుకుతున్నాయి. టెక్ కంపెనీలు పరిశీలిస్తున్న కొన్ని సృజనాత్మక ఎంపికలు ఇక్కడ ఉన్నాయి.
Google డాక్స్, షీట్లు మరియు స్లయిడ్లలో అందుబాటులో ఉన్న వినియోగదారు డేటాను ఉపయోగించడాన్ని Google చూసింది.
గత వేసవిలో, గూగుల్ యొక్క న్యాయ విభాగం వినియోగదారుల డేటాను ఉపయోగించడం గురించి దాని భాషను విస్తరించమని ఉద్యోగులను అడగడం ప్రారంభించిందని టైమ్స్ నివేదించింది. Google డాక్స్, Google షీట్లు, Google స్లయిడ్లు మరియు Google Maps యొక్క ఉచిత వినియోగదారు వెర్షన్లలో రెస్టారెంట్ సమీక్షల నుండి డేటాను కంపెనీ ఉపయోగించాలనుకుంటున్నట్లు కొంతమంది ఉద్యోగులకు తెలియజేయబడింది.
Google తన గోప్యతా విధానాన్ని జూలై 2023లో అప్డేట్ చేసింది, అయితే దాని AI మోడల్లకు శిక్షణ ఇవ్వడానికి ఉపయోగించే డేటా రకాలను విస్తరించలేదని కంపెనీ తెలిపింది.
పబ్లిషర్ సైమన్ & షుస్టర్పై స్ప్లర్జ్.
మెటా వద్ద, అందుబాటులో ఉన్న డేటా సరఫరా తగ్గిపోవడం గురించి ఎగ్జిక్యూటివ్లు ఆందోళన చెందారు మరియు ప్రత్యామ్నాయాల గురించి ఆలోచించేందుకు గత సంవత్సరం మార్చి మరియు ఏప్రిల్లలో దాదాపు ప్రతిరోజూ సమావేశమయ్యారు, టైమ్స్ నివేదించింది.
ఈ సమావేశాల నుండి ఉద్భవించిన ఆలోచనలలో ఒకటి సైమన్ & షుస్టర్ను కొనుగోలు చేయడం. స్టీఫెన్ కింగ్ మరియు జెన్నిఫర్ వీనర్ వంటి రచయితలతో కలిసి పనిచేసిన ప్రముఖ ప్రచురణకర్తను ప్రైవేట్ ఈక్విటీ సంస్థ KKR గత సంవత్సరం $1.62 బిలియన్లకు కొనుగోలు చేసింది.
ఇతర హాజరైనవారు కొత్త శీర్షికలకు పూర్తి లైసెన్సింగ్ హక్కుల కోసం ప్రతి పుస్తకానికి $10 చెల్లించే మరింత బడ్జెట్-స్నేహపూర్వక ఎంపికను సూచించారు.
సింథటిక్ డేటాను రూపొందిస్తోంది
సింథటిక్ డేటా అనేది AI సిస్టమ్ ద్వారా రూపొందించబడిన డేటా, మరియు OpenAI దీనిని మోడల్లకు ఒక ఎంపికగా పరిగణిస్తుంది.
పేపర్ ప్రకారం, OpenAI CEO సామ్ ఆల్ట్మాన్ గత మేలో జరిగిన సాంకేతిక సదస్సులో “మంచి సింథటిక్ డేటాను రూపొందించడానికి తగినంత స్మార్ట్ సింథటిక్ డేటా యొక్క ఈవెంట్ హోరిజోన్ను మోడల్ జీవించగలిగినంత కాలం, అంతా బాగానే ఉంటుంది” అని అన్నారు.
సింథటిక్ డేటాపై AI సిస్టమ్లకు శిక్షణ ఇవ్వడంలో సమస్య ఏమిటంటే ఇది AI యొక్క కొన్ని తప్పులు మరియు పరిమితులను బలోపేతం చేయగలదు, టైమ్స్ నివేదించింది. దీన్ని పరిష్కరించడానికి, OpenAI ఒక AI సిస్టమ్ డేటాను ఉత్పత్తి చేసే ప్రక్రియపై పని చేస్తోంది మరియు మరొక AI సిస్టమ్ దాని గురించి నిర్ణయాలు తీసుకుంటుంది.
ఫిబ్రవరి 28న, బిజినెస్ ఇన్సైడర్ యొక్క మాతృ సంస్థ అయిన ఆక్సెల్ స్ప్రింగర్, కంపెనీ యొక్క ప్రకటనల పద్ధతుల వల్ల నష్టాన్ని ఆరోపిస్తూ డచ్ కోర్టులో Googleకి వ్యతిరేకంగా $2.3 బిలియన్ల దావా వేయడంలో 31 ఇతర మీడియా సమూహాలలో చేరింది. నేను మిమ్మల్ని మేల్కొన్నాను.
ఆక్సెల్ స్ప్రింగర్, బిజినెస్ ఇన్సైడర్ యొక్క మాతృ సంస్థ, దాని మీడియా బ్రాండ్ల రిపోర్టింగ్ ఆధారంగా మోడల్లకు శిక్షణ ఇవ్వడానికి OpenAIని అనుమతించే గ్లోబల్ డీల్ని కలిగి ఉంది.
[ad_2]
Source link