Gretel AI-k estandar berri bat ezartzen du bere Testutik SQL datu-multzo integrala abian jartzearekin

Gretel AI-k estandar berri bat ezartzen du bere Testutik SQL datu-multzo integrala abian jartzearekin

Gretel AI-k joko-aldaketaren ekarpena egin du adimen artifizialaren (AI) aurrerapenerako, orain arteko Test-to-SQL datu multzo zabalena kaleratuz. Asmakizun honek AI ereduen prestakuntza asko bizkortzeko ahalmena du, industria ugaritako datuetatik lortutako informazioen kalitatea areagotuz.

Hugging Face-n ostatatutako Gretelen_text_to_sql datu-multzo sintetikoak 105.851 erregistro ditu, horietatik 100.000 trebakuntzarako eta 5.851 baliozkotzeko. Datu multzo handi honek 23 milioi token inguru ditu guztira, 100 sektore edo domeinu ezberdinetako 12 milioi SQL token inguru barne. SQL zeregin sorta zabala ebatzi nahi du, datuen definizioa, berreskurapena, aldaketa, analitika eta txostenak barne, SQL konplexutasun maila ezberdinekin.

Datu-multzo hau bere sorreran bere tamaina izugarriagatik eta xehetasunei arreta zainduagatik nabarmentzen da. Datu-basearen ezarpenak barne hartzen ditu, hala nola, taulak eta ikuspegiak sortzeko adierazpenak, SQL kontsulten hizkuntza naturalen deskribapenak eta testuinguruko etiketak ereduaren prestakuntza hobetzen laguntzeko. Sakontasun- eta aniztasun-maila horrek nabarmen murrizten ditu datu-taldeek datuen kalitatea hobetzera bideratzen dituzten denbora eta baliabideak, normalean beren ahaleginen % 80ra arte.

Gaur egungo datuetan oinarritutako munduan, datu-baseetatik informazioa azkar eta fidagarritasunez ateratzeko gai izatea garrantzitsua da. Text-to-SQL, datu-baseen kontsultak hizkuntza arruntean egiteko aukera ematen duena, urrats kritiko gisa ikusten da datuak eskuragarriago bihurtzeko. Hala ere, kalitate handiko eta askotariko Text-to-SQL prestakuntzako datuen faltak teknologia honen aurrerapena eta hobekuntza moteldu du.

Gretelen datu-multzoak hutsune hori itxi nahi du, Hizkuntza Eredu Handiak (LLM) testu-to-SQL zereginetan entrenatzeko baliabide fidagarri bat eskainiz. Datuen ezagutzarako sarbide zabala eskaintzen du eta datu-baseekin modu naturalago batean elkarreragin dezaketen AI aplikazioen garapena errazten du.

_text_to_sql datu-multzo sintetikoa sortzeak erronkak ekarri zituen, batez ere datuen kalitate altua mantentzeko eta lizentziaren zailtasunak negoziatzeko, maiz lehendik dauden datu multzoen erabilera eta hedapena mugatzen dutenak. Gretelek zailtasun horiei aurre egin zien Navigator tresnarekin, AI sistema korapilatsu bat erabiltzen duena kalitate handiko datu sintetikoak eskala handian sortzeko.

LLMak ebaluatzaile gisa erabiltzea datu-multzoaren kalitatea ebaluatzeko ikuspegi berritzailea izan zen. Ikuspegi hau nahiko eraginkorra dela frogatu da, giza datuen ebaluazio-irizpideekin bat eginez eta datu-multzoaren SQL-a betetzen dela, zehaztasuna eta arauekiko atxikimendua frogatuz, beste datu-multzo batzuk gaindituz.

Gretel AI-k Hugging Face-n _text_to_sql datu-multzo sintetikoa kaleratzeak lorpen garrantzitsu bat markatzen du datu sintetikoen arloan. Kode irekiko datu multzo masibo eta anitza aurkezten du, Text-to-SQL teknologien garapena bizkortuz eta kalitate handiko datuek AI sistema eraginkorrak sortzeko duten garrantzia azpimarratuz.

Code Labs Academy © 2025 Eskubide guztiak erreserbatuta.