CLIs mais simples com Util.parseArgs
Lucas Santos
Posted on October 21, 2022
Aplicações de linha de comando, os famosos CLI's (Command Line Interfaces), são extremamente comuns, principalmente quando estamos lidando com devs.
Essas aplicações costumam ser ordens de grandeza mais leves do que uma aplicação com uma interface gráfica, são mais simples de serem utilizadas e permitem automação e scripting de forma nativa, tudo isso sacrificando a interface e um pouco da experiência de usuário, já que é necessário que você tenha um pouco – ou as vezes, muito – conhecimento de ambientes de linha de comando para poder começar a usar as funcionalidades básicas.
Enquanto a psrte de UI está ficando cada vez mais avançada com bibliotecas como o blessed, e a UX está cada vez mais avançada com outras libs como o inquirer, a DX, ou Developer Experience, continua a mesma. Desenvolver um CLI acaba sendo complicado e cheio de pequenos hacks que temos que fazer, principalmente para poder entender o que o usuário enviou no comando inicial, os chamados argumentos.
Hoje, algumas bibliotecas famosas como o Yargs, o commander, meow e caporal facilitam a tarefa de ter que pegar os argumentos da linha de comando e enviá-las para a aplicação executar alguma coisa, mas isso é algo tão simples que as pessoas se perguntam: "Por que isso não é nativo do Node.js?", bom essa espera acabou.
util.parseArgs
Na versão 18, o Node.js implementou uma API experimental chamada util.parseArgs
. O objetivo é justamente facilitar e automatizar a forma como buscamos argumentos de linha de comando para melhorar (e até mesmo eliminar) a necessidade de bibliotecas externas para fazer a mesma coisa.
Ela tem uma API bastante simples, que leva apenas um objeto de configuração:
import { parseArgs } from 'node:util'
const { values, positionals } = parseArgs({ args, options })
O objeto de configuração tem quatro opções:
-
args
: O array de argumentos que queremos parsear, por padrão, ele vai ser oprocess.argv
removenvo os dois primeiros argumentos que são oexecPath
e ofilename
(o caminho do comando do Node que foi executado e o nome do arquivo que está rodando) e deixando apenas o que veio depois. -
options
: É um outro objeto que é usado para definir quais são os argumentos que vão ser identificados como válidos pelo programa, essa chave é obrigatória e é um objeto com itens que devem seguir essa interface:-
type
: Uma string definindo qual é o tipo do argumento, no momento oparseArgs
só suportastring
eboolean
-
multiple
: Um boolean que define se o argumento pode ser passado múltiplas vezes. Se fortrue
, todos os valores desse argumento vão ser coletados em um array, caso contrário, a última opção setada vai ser a escolhida. Por padrão, o valor éfalse
-
short
: O alias da opção em um único caractere, por exemplo, a abreviação de--all
ser-A
então oshort
seráA
-
-
strict
: Se o programa deve lançar um erro caso algum argumento não reconhecido poroptions
seja passado, étrue
por padrão -
allowPositionals
: Se o comando vai aceitar argumentos posicionais, ou seja, se podemos passar argumentos que não tem flags como-a
, esses argumentos serão recebidos em um array próprio que fizemos o destructuring comopositionals
-
tokens
: Retorna os tokens que foram passados. Essa função é mais útil quando você quer estender o comportamento da função original, não tanto quando você quer apenas usar a base da função.
O retorno do parseArgs
é um objeto com três chaves:
-
values
: Um mapa de todos os nomes das opções com seus valores respectivos -
positionals
: Um array de strings com os argumentos posicionais passados, em ordem. -
tokens
: Um array de objetos retornado se a opçãotokens
da configuração fortrue
O objeto de tokens pode ter tokens de dois tipos, ou opções ou argumentos posicionais. Todos eles vão ser retornados em um único objeto que vai ter todos os tokens. Todos os valores desse objeto vão ter pelo menos duas chaves:
-
kind
: Ouoption
oupositional
ouoption-terminator
-
index
: O indice do elemento no array de argumentos, de forma que o argumento original de um token possa ser obtido comargs[token.index]
Para tokens do tipo opções (os que tem as flags), vamos ter algumas propriedades extras:
-
name
: O nome longo do token, por exemplosall
-
rawName
: O nome original da opção, sem remover os traços, do jeito que foi passado para o comando, por exemplo,--all
-
value
: O valor do argumento, se for um boolean, esse valor vai serundefined
-
inlineValue
: Se o valor foi especificado de forma inline como--foo=bar
Pra argumentos posicionais, sem opções, só vamos ter o valor em uma chave value
que é o equivalente a args[index]
Esses tokens vão ser sempre retornados na ordem que foram passados, então é possível estener a funcionalidade caso você precise suportar algum tipo de argumento antes de outro argumento.
Outra coisa importante é quando temos os chamados short option groups, que são casos como -abc
nesses casos, cada um deles vai ser expandido para um token diferente, então se tivermos casos comuns como -vvv
vamos ter três tokens do tipo option.
Vamos a alguns exemplos.
Opções simples
Imagine que temos o seguinte código:
const options = {
verbose: {
type: 'boolean',
short: 'v',
},
color: {
type: 'string',
short: 'c',
},
times: {
type: 'string',
short: 't',
},
}
const { values, positionals } = parseArgs({options, args: ['-v', '-c', 'green']})
Teremos em values
o seguinte objeto:
{
__proto__ : null,
verbose: true,
color: 'green'
}
Já o nosso array de positionals
será vazio porque não estamos específicando que queremos posicionais. Veja que em values
as chaves serão sempre os nomes completos das opções.
Parâmetros posicionais
Se modificarmos o código para permitir positionals
dessa forma:
const { values, positionals } = parseArgs({
options,
allowPositionals: true,
args: [
'home.html', '--verbose', 'main.js', '--color', 'red', 'post.md'
]
})
Vamos ter a seguinte saída em values
:
{
__proto__ :null,
verbose: true,
color: 'red'
}
Porém agora vamos ter um array de opções posicionais em positionals
:
['home.html', 'main.js', 'post.md']
Veja que eles aparecem na ordem que estamos enviando no código.
Opções múltiplas
Se utilizarmos a mesma opção várias vezes normalmente, como eu mencionei antes, somente uma chave vai ser criada, por exemplo:
const options = {
'bool': {
type: 'boolean',
},
'str': {
type: 'string',
},
}
parseArgs({
options, args: [
'--bool', '--bool', '--str', 'yes', '--str', 'no'
]
})
Vamos ter um values
como:
{
__proto__ :null,
bool: true,
str: 'no'
}
Veja que só temos o último valor da opção. Agora, se passarmos o parâmetro multiple
para qualquer tipo de opção no nosso objeto options
:
const options = {
'bool': {
type: 'boolean',
multiple: true,
},
'str': {
type: 'string',
multiple: true,
},
}
parseArgs({
options, args: [
'--bool', '--bool', '--str', 'yes', '--str', 'no'
]
})
Vamos ter o seguinte valor em values
:
{
__proto__ :null,
bool: [true, true],
str: ['yes', 'no']
}
Shorthands conexos
Existe um tipo de valor que podemos passar para uma linha de comando que é conhecida como shorthand , a ideia é que, quando setamos múltiplas opções booleanas, podemos agrupar todos em um único -
, por exemplo, ao invés de main.js -v -s
podemos fazer main.js -vs
.
Isso também funciona no parseArgs
sem precisar fazer nada de mais, só precisamos setar a opção short
para essas propriedades:
const options = {
'verbose': {
type: 'boolean',
short: 'v',
},
'silent': {
type: 'boolean',
short: 's',
},
'color': {
type: 'string',
short: 'c',
},
}
parseArgs({options, args: ['-vs']})
Vai nos dar esse objeto de values
:
{
__proto__ :null,
verbose: true,
silent: true,
}
Option terminators
Existe um tipo de opção específica chamada de terminator , isso é, após esse argumento, todo o resto é tratado como posicional. No caso da maioria dos shells, essa opção é o --
, por exemplo, quando queremos executar um comando do NPM antigamente e enviar um argumento ao comando que seria executado, fazíamos: npm run <comando> -- param param param
e o comando iria receber os três parâmetros individualmente. O mesmo vale para o parseArgs
:
const options = {
'verbose': {
type: 'boolean',
},
'count': {
type: 'string',
},
}
parseArgs({options, allowPositionals: true,
args: [
'how',
'--verbose',
'are',
'--',
'--count',
'5',
'you'
]
})
O objeto values
será:
{
__proto__ :null,
verbose: true
}
E vamos ter os positionals
:
['how', 'are', '--count', '5', 'you']
Tokens
Quando falamos de tokens, a funcionalidade é um pouco mais complexa, pra isso precisamos explicar como essa API funciona, de fato.
O parseArgs
funciona em duas fases:
- A primeira fase é parsear o array de argumentos em um array de tokens. O objetivo disso é que a gente tenha uma espécie de array de argumentos parseados parecidos com o que a gente já tem, mas com anotações de tipos, se o argumento é uma opção, se é um argumento posicional e etc
- Na segunda fase, a saída dessa primeira fase é lida pelo parser e acabamos com o array que temos anteriormente.
A gente pode ter acesso à primeira parte como uma saída se setarmos o array de configurações com a opção tokens
como true
. Ai vamos ter uma chave tokens
na saída final.
O tipo desse objeto vai ser a seguinte interface (como explicada aqui):
type Token = OptionToken | PositionalToken | OptionTerminatorToken;
interface CommonTokenProperties {
/** Onde o token começa na string? */
index: number;
}
interface OptionToken extends CommonTokenProperties {
kind: 'option';
/** Nome longo */
name: string;
/** O nome da opção no array `args` */
rawName: string;
/** O valor da opção. Sempre `undefined` para boolean. */
value: string | undefined;
/** O valor está inline (ex --level=5)? */
inlineValue: boolean | undefined;
}
interface PositionalToken extends CommonTokenProperties {
kind: 'positional';
/** O valor do argumento posicional, args[token.index] */
value: string;
}
interface OptionTerminatorToken extends CommonTokenProperties {
kind: 'option-terminator';
}
Vamos a um exemplo, digamos que temos o seguinte array de opções:
const options = {
'bool': {
type: 'boolean',
short: 'b',
},
'flag': {
type: 'boolean',
short: 'f',
},
'str': {
type: 'string',
short: 's',
},
}
Quando rodarmos parseArgs({ options, tokens: true, args: ['--bool', '-b', '-bf'] })
, vamos obter o seguinte objeto:
{
values: {
__proto__ :null,
bool: true,
flag: true,
},
positionals: [],
tokens: [
{
kind: 'option',
name: 'bool',
rawName: '--bool',
index: 0,
value: undefined,
inlineValue: undefined
},
{
kind: 'option',
name: 'bool',
rawName: '-b',
index: 1,
value: undefined,
inlineValue: undefined
},
{
kind: 'option',
name: 'bool',
rawName: '-b',
index: 2,
value: undefined,
inlineValue: undefined
},
{
kind: 'option',
name: 'flag',
rawName: '-f',
index: 2,
value: undefined,
inlineValue: undefined
},
]
}
É importante notar que, mesmo que a gente tenha uma única opção chamada bool
, vamos ter três índices no array porque estamos passando a chave três vezes. Um exemplo mais completo pode ser usando terminadores e também inline values como aqui:
parseArgs({
options, allowPositionals: true, tokens: true,
args: [
'command', '--', '--str', 'yes', '--str=yes'
]
})
Que vai nos dar a seguinte saída:
{
values: {
__proto__ :null,
},
positionals: ['command', '--str', 'yes', '--str=yes'],
tokens: [
{ kind: 'positional', index: 0, value: 'command' },
{ kind: 'option-terminator', index: 1 },
{ kind: 'positional', index: 2, value: '--str' },
{ kind: 'positional', index: 3, value: 'yes' },
{ kind: 'positional', index: 4, value: '--str=yes' }
]
}
Veja que quando usamos um terminador, todos os demais valores são considerador posicionais.
Um exemplo seria usar essa funcionalidade para poder implementar um CLI que usa subcomandos, como por exemplo o git com git commit
ou a Azure com az aks create
. Vou passar por essa implementação explicando como ela funcionaria.
Primeiro, vamos definir uma função para buscar o primeiro comando, que é um posicional, e depois vamos buscar o primeiro elemento posicional que acharmos:
function parseSubcommand(config) {
// Permitindo posicionais já que o subcomando é posicional
const {tokens} = parseArgs({
...config, tokens: true, allowPositionals: true
});
// Encontra a primeira ocorrência do posicional
let firstPosToken = tokens.find(({kind}) => kind==='positional');
if (!firstPosToken) {
throw new Error('Command name is missing: ' + config.args);
}
Depois vamos pegar as opções do comando e chamar o parseArgs novamente:
const cmdArgs = config.args.slice(0, firstPosToken.index);
// Substituímos a ocorrencia em `config.args`
const commandResult = parseArgs({
...config, args: cmdArgs, tokens: false, allowPositionals: false
})
Agora vamos pegar o subcomando desse comando:
const subcommandName = firstPosToken.value
const subcmdArgs = config.args.slice(firstPosToken.index+1)
// substituindo o `config.args`
const subcommandResult = parseArgs({
...config, args: subcmdArgs, tokens: false
})
return {
commandResult,
subcommandName,
subcommandResult,
}
}
A função toda ficaria assim:
function parseSubcommand(config) {
const {tokens} = parseArgs({
...config, tokens: true, allowPositionals: true
})
let firstPosToken = tokens.find(({kind}) => kind==='positional')
if (!firstPosToken) {
throw new Error('Command name is missing: ' + config.args)
}
//----- Command options
const cmdArgs = config.args.slice(0, firstPosToken.index)
const commandResult = parseArgs({
...config, args: cmdArgs, tokens: false, allowPositionals: false
})
//----- Subcommand
const subcommandName = firstPosToken.value;
const subcmdArgs = config.args.slice(firstPosToken.index+1)
const subcommandResult = parseArgs({
...config, args: subcmdArgs, tokens: false
})
return {
commandResult,
subcommandName,
subcommandResult,
}
}
Conclusão
O parseArgs
é uma excelente opção para facilitar a criação de CLIs e mostrar como podemos melhorar ainda mais o desenvolvimento de aplicações usando Node.js. Não se esqueça de ler a documentação oficial e o artigo que mostrei nesse post!
Posted on October 21, 2022
Join Our Newsletter. No Spam, Only the good stuff.
Sign up to receive the latest update from our blog.