Ó chuma ChatGPT agus Google Gemini, tá go leor aipeanna á seoladh againn ag giaráil na múnlaí sin. Tugtar arbatráiste ar an teicníc, modh a thógann ceann de na tascanna iolracha is féidir le AI a dhéanamh, a fheabhsaíonn leideanna éifeachtacha é, agus ansin cuireann sé ar fáil do chustaiméirí mar ghné é.
Beidh an t-alt seo ina threoir céim ar chéim ar conas samhail Google Gemini a chomhtháthú inár bhfeidhmchlár Node.js. Feicfimid conas Gemini-pro a úsáid a láimhseálann téacs ginideach, agus Gemini-pro-vision a láimhseálann íomhánna.
Tosóimid ar dtús tríd an tionscadal a chur ar bun, agus ansin é a úsáid ar shampla dár gcuid féin.
Riachtanais
-
Node.js leagan 18+
-
cuntas Google AI Platform chun ár n-Eochair API a fháil
Ag tosú
Ar dtús, cruthaigh tionscadal nua Node.js taobh istigh d’fhillteán folamh:
mkdir gemini-node
cd gemini-node
npm init -y
Anois, déanfaimid na pacáistí riachtanacha le haghaidh comhad timpeallachta agus an Gemini SDK a shuiteáil:
npm install dotenv @google/generative-ai
Socrú Eochracha API
Ar do Google AI Platform, cliceáil ar an gcnaipe Faigh Eochair API chun an Eochair API a fháil agus ansin é a shábháil i do chomhad timpeallachta (.env) sa fhréamh-eolaire:
API_KEY=YOUR_GEMINI_KEY
Cruthaigh fillteán lib nua agus cruthaigh comhad config.js laistigh de, ansin don chéad chéim eile, easpórtálfaimid ár Eochair API:
const dotenv = require("dotenv");
dotenv.config();
const API_KEY = process.env.API_KEY;
module.exports = { API_KEY };
Socrú Gemini SDK
Sa chéim seo, socróimid ár múnlaí ionas gur féidir linn iad a úsáid inár gcód. Taobh istigh dár bhfillteán lib, cruthaimis 2 chomhad, gemini.js chun téacs a láimhseáil agus gemini-vision.js chun íomhánna a láimhseáil.
1- Google Gemini Pro
const { GoogleGenerativeAI } = require("@google/generative-ai");
const { API_KEY } = require("./config");
const googleAI = new GoogleGenerativeAI(API_KEY);
const geminiConfig = {
temperature: 0.9,
topP: 1,
topK: 1,
maxOutputTokens: 4096,
};
const geminiModel = googleAI.getGenerativeModel({
model: "gemini-pro",
geminiConfig,
});
const generateText = async (prompt) => {
try {
const result = await geminiModel.generateContent(prompt);
const response = result.response;
return response.text();
} catch (error) {
console.log("response error", error);
}
};
module.exports = { generateText };
Úsáidfimid an fheidhm easpórtáilte chun téacs a ghiniúint ó leid. Is féidir linn é a úsáid chun córas comhrá a thógáil, aistriúchán téacs agus go leor cásanna úsáide eile.
2- Google Gemini Vision
const { GoogleGenerativeAI } = require("@google/generative-ai");
const { API_KEY } = require("./config");
const fs = require("fs");
const googleAI = new GoogleGenerativeAI(API_KEY);
const geminiConfig = {
temperature: 0.4,
topP: 1,
topK: 32,
maxOutputTokens: 4096,
};
const geminiModel = googleAI.getGenerativeModel({
model: "gemini-pro-vision",
geminiConfig,
});
const interactWithImage = async (filePath) => {
try {
const imageFile = fs.readFileSync(filePath);
const imageBase64 = imageFile.toString("base64");
const promptConfig = [
{ text: "Generate a caption from this image" },
{
inlineData: {
mimeType: "image/jpeg",
data: imageBase64,
},
},
];
const result = await geminiModel.generateContent({
contents: [{ role: "user", parts: promptConfig }],
});
return result.response.text();
} catch (error) {
console.log("response error", error);
}
};
module.exports = { interactWithImage };
Úsáidfimid an fheidhm easpórtáilte chun téacs a ghiniúint ó íomhá.
Ag tógáil na haipe
Cruthaigh comhad index.js nua agus greamaigh an cód seo:
const main = async () => {
console.log("Hello world!");
};
main();
Anois, is féidir linn ár bhfeidhmeanna easpórtála a allmhairiú agus iad a úsáid chun téacs a ghiniúint, ó cheist nó ó íomhá leid.
Glacann an fheidhm cosán comhaid mar argóint, mar sin beidh ort comhad íomhá a chur le d'fhillteán tionscadail chun é a thástáil.
Déanfar ár gcód a thiontú go:
const { generateText } = require("./lib/gemini");
const { interactWithImage } = require("./lib/gemini-vision");
const path = require("path");
const main = async () => {
// Text Generation
let textFromPrompt = await generateText(
"tell me about bootcamps in a sentence"
);
console.log(textFromPrompt);
// Caption Generation
const directoryName = path.join(__dirname, "fish.jpg");
let captionFromImage = await interactWithImage(directoryName);
console.log(captionFromImage);
};
main();
Cad atá romhainn
Anois, is féidir leat ExpressJS a úsáid chun API a thógáil in ionad script. Is féidir leat freisin taighde a dhéanamh ar na cleachtais is fearr maidir le leideanna a scríobh do do chásanna úsáide.
Seo roinnt samplaí ar aipeanna is féidir leat a thógáil:
-
Gineadóir sonraí Meta Sinsearach ag baint úsáide as Unsplash API
-
Atosaigh an t-athbhreithneoir trí script bhreise a chur leis a gheobhaidh ábhar ó PDF
-
Scríbhneoir beatha Instagram ó íomhá
An bhfuil suim agat aipeanna níos fearr a thógáil? Bí páirteach inár mbothcamp Forbartha Gréasáin agus foghlaim conas táirge lánfheidhmiúil a thógáil!