Feidhmchlár AI a Thógáil i 10 Nóiméad: Treoir Céim ar Chéim

Gemini
Nodejs
AI
Treoir
Feidhmchlár AI a Thógáil i 10 Nóiméad: Treoir Céim ar Chéim cover image

Ó chuma ChatGPT agus Google Gemini, tá go leor aipeanna á seoladh againn ag giaráil na múnlaí sin. Tugtar arbatráiste ar an teicníc, modh a thógann ceann de na tascanna iolracha is féidir le AI a dhéanamh, a fheabhsaíonn leideanna éifeachtacha é, agus ansin cuireann sé ar fáil do chustaiméirí mar ghné é.

Beidh an t-alt seo ina threoir céim ar chéim ar conas samhail Google Gemini a chomhtháthú inár bhfeidhmchlár Node.js. Feicfimid conas Gemini-pro a úsáid a láimhseálann téacs ginideach, agus Gemini-pro-vision a láimhseálann íomhánna.

Tosóimid ar dtús tríd an tionscadal a chur ar bun, agus ansin é a úsáid ar shampla dár gcuid féin.

Riachtanais

Ag tosú

Ar dtús, cruthaigh tionscadal nua Node.js taobh istigh d’fhillteán folamh:

mkdir gemini-node  
cd gemini-node
npm init -y

Anois, déanfaimid na pacáistí riachtanacha le haghaidh comhad timpeallachta agus an Gemini SDK a shuiteáil:

npm install dotenv @google/generative-ai

Socrú Eochracha API

Ar do Google AI Platform, cliceáil ar an gcnaipe Faigh Eochair API chun an Eochair API a fháil agus ansin é a shábháil i do chomhad timpeallachta (.env) sa fhréamh-eolaire:

API_KEY=YOUR_GEMINI_KEY

Cruthaigh fillteán lib nua agus cruthaigh comhad config.js laistigh de, ansin don chéad chéim eile, easpórtálfaimid ár Eochair API:

const  dotenv  =  require("dotenv");
dotenv.config();

const  API_KEY  =  process.env.API_KEY;

module.exports  = { API_KEY };

Socrú Gemini SDK

Sa chéim seo, socróimid ár múnlaí ionas gur féidir linn iad a úsáid inár gcód. Taobh istigh dár bhfillteán lib, cruthaimis 2 chomhad, gemini.js chun téacs a láimhseáil agus gemini-vision.js chun íomhánna a láimhseáil.

1- Google Gemini Pro

const { GoogleGenerativeAI } = require("@google/generative-ai");
const { API_KEY } = require("./config");

const googleAI = new GoogleGenerativeAI(API_KEY);
const geminiConfig = {
  temperature: 0.9,
  topP: 1,
  topK: 1,
  maxOutputTokens: 4096,
};

const geminiModel = googleAI.getGenerativeModel({
  model: "gemini-pro",
  geminiConfig,
});

const generateText = async (prompt) => {
  try {
    const result = await geminiModel.generateContent(prompt);
    const response = result.response;
    return response.text();
  } catch (error) {
    console.log("response error", error);
  }
};

module.exports = { generateText };

Úsáidfimid an fheidhm easpórtáilte chun téacs a ghiniúint ó leid. Is féidir linn é a úsáid chun córas comhrá a thógáil, aistriúchán téacs agus go leor cásanna úsáide eile.

2- Google Gemini Vision

const { GoogleGenerativeAI } = require("@google/generative-ai");
const { API_KEY } = require("./config");
const fs = require("fs");

const googleAI = new GoogleGenerativeAI(API_KEY);
const geminiConfig = {
  temperature: 0.4,
  topP: 1,
  topK: 32,
  maxOutputTokens: 4096,
};

const geminiModel = googleAI.getGenerativeModel({
  model: "gemini-pro-vision",
  geminiConfig,
});

const interactWithImage = async (filePath) => {
  try {
    const imageFile = fs.readFileSync(filePath);
    const imageBase64 = imageFile.toString("base64");

    const promptConfig = [
      { text: "Generate a caption from this image" },
      {
        inlineData: {
          mimeType: "image/jpeg",
          data: imageBase64,
        },
      },
    ];

    const result = await geminiModel.generateContent({
      contents: [{ role: "user", parts: promptConfig }],
    });

    return result.response.text();
  } catch (error) {
    console.log("response error", error);
  }
};

module.exports = { interactWithImage };

Úsáidfimid an fheidhm easpórtáilte chun téacs a ghiniúint ó íomhá.

Ag tógáil na haipe

Cruthaigh comhad index.js nua agus greamaigh an cód seo:

const main = async () => {
  console.log("Hello world!");
};

main();

Anois, is féidir linn ár bhfeidhmeanna easpórtála a allmhairiú agus iad a úsáid chun téacs a ghiniúint, ó cheist nó ó íomhá leid.

Glacann an fheidhm cosán comhaid mar argóint, mar sin beidh ort comhad íomhá a chur le d'fhillteán tionscadail chun é a thástáil.

Déanfar ár gcód a thiontú go:

const { generateText } = require("./lib/gemini");
const { interactWithImage } = require("./lib/gemini-vision");
const path = require("path");

const main = async () => {
  // Text Generation
  let textFromPrompt = await generateText(
    "tell me about bootcamps in a sentence"
  );
  console.log(textFromPrompt);

  // Caption Generation
  const directoryName = path.join(__dirname, "fish.jpg");
  let captionFromImage = await interactWithImage(directoryName);
  console.log(captionFromImage);
};

main();

Cad atá romhainn

Anois, is féidir leat ExpressJS a úsáid chun API a thógáil in ionad script. Is féidir leat freisin taighde a dhéanamh ar na cleachtais is fearr maidir le leideanna a scríobh do do chásanna úsáide.

Seo roinnt samplaí ar aipeanna is féidir leat a thógáil:

  • Gineadóir sonraí Meta Sinsearach ag baint úsáide as Unsplash API

  • Atosaigh an t-athbhreithneoir trí script bhreise a chur leis a gheobhaidh ábhar ó PDF

  • Scríbhneoir beatha Instagram ó íomhá

An bhfuil suim agat aipeanna níos fearr a thógáil? Bí páirteach inár mbothcamp Forbartha Gréasáin agus foghlaim conas táirge lánfheidhmiúil a thógáil!


By Omar Mokhfi

Career Services background pattern

Seirbhísí Gairme

Contact Section background image

Bígí i dteagmháil

Code Labs Academy © 2024 Gach ceart ar cosaint.