首页 程序笔记 .NET自然语言转换为SQL的Nl2Sql项目

.NET自然语言转换为SQL的Nl2Sql项目

随着技术的发展,人工智能在各个领域的应用已经不再是新鲜事。在数据库查询领域能够自然地将人类语言转换为SQL语句将为不懂技术的人士提供极大的便捷,同时也能大幅提高专业开发者的工作效率。今天,我带大家深入了解一个非常有趣的项目——Nl2Sql,这个项目是基于.NET平台和Semantic Kernel的工具,它可以将自然语言转换为SQL查询语句。

Nl2Sql GitHub地址:https://github.com/microsoft/kernel-memory/tree/NL2SQL/examples/200-dotnet-nl2sql

GPT-4的出现,使得基于自然语言处理的技术跨越了一个新的门槛,尤其是在自然语言转换成SQL语句的能力上有了显著提升。Nl2Sql工具就是利用GPT-4和Semantic Kernel的强大功能,为我们提供了一个实验和测试平台,能够基于自然语言表达生成SQL查询语句。

项目结构与样例信息

在开源的Nl2Sql项目中,我们可以看到以下几个组成部分:

nl2sql.config - 包含了设置说明、数据模式和语义提示。 nl2sql.console - 控制台应用,用于将自然语言目标转换成SQL查询。 nl2sql.library - 支持库,同样用于自然语言到SQL的转换。 nl2sql.harness - 开发调试工具,用于实时逆向工程化数据库模式。 nl2sql.sln - Visual Studio解决方案文件。

运行样例的第一步是进行初始设置和配置。

核心方法解析

我们来看一看Nl2Sql功能的实现关键。该程序采用.NET的开发框架,通过一系列方法来完成从输入的自然语言到输出的SQL查询的转换。这个过程涉及到自然语言理解、数据库模式解析和查询生成等环节。

private async Task ExecuteConsoleAsync(CancellationToken stoppingToken)
{
 var schemaNames = SchemaDefinitions.GetNames().ToArray();
 await SchemaProvider.InitializeAsync(
 this._memory,
 schemaNames.Select(s => Path.Combine(Repo.RootConfigFolder, "schema", $"{s}.json"))).ConfigureAwait(false);

 this.WriteIntroduction(schemaNames);

 while (!stoppingToken.IsCancellationRequested)
 {
 var objective = await ReadInputAsync().ConfigureAwait(false);
 if (string.IsOrWhiteSpace(objective))
 {
 continue;
 }

 var result =
 await this._queryGenerator.SolveObjectiveAsync(objective).ConfigureAwait(false);

 await ProcessQueryAsync(result).ConfigureAwait(false);
 }

 this.WriteLine();

 // Capture console input with cancellation detection
 async Task<string?> ReadInputAsync()
 {
 this.Write(SystemColor, "# ");

 var inputTask = Console.In.ReadLineAsync(stoppingToken).AsTask();
 var objective = await inputTask.ConfigureAwait(false);

 // response occurs when blocking input is cancelled (CTRL+C)
 if ( == objective)
 {
 this.WriteLine();
 this.WriteLine(FocusColor, "Cancellation detected...");

 // Yield to sync stoppingToken state
 await Task.Delay(TimeSpan.FromMilliseconds(300), stoppingToken).ConfigureAwait(false);
 }
 else if (string.IsOrWhiteSpace(objective))
 {
 this.WriteLine(FocusColor, $"Please provide a query related to the defined schemas.{Environment.NewLine}");
 }
 else
 {
 this.ClearLine(previous: true);
 this.WriteLine(QueryColor, $"# {objective}");
 }

 return objective;
 }

 // Display query result and (optionally) execute.
 async Task ProcessQueryAsync(SqlQueryResult? result)
 {
 if (result == )
 {
 this.WriteLine(FocusColor, $"Unable to translate request into a query.{Environment.NewLine}");
 return;
 }

 this.WriteLine(SystemColor, $"{Environment.NewLine}SCHEMA:");
 this.WriteLine(QueryColor, result.Schema);
 this.WriteLine(SystemColor, $"{Environment.NewLine}QUERY:");
 this.WriteLine(QueryColor, result.Query);

 if (!this.Confirm($"{Environment.NewLine}Execute?"))
 {
 this.WriteLine();
 this.WriteLine();
 return;
 }

 await Task.Delay(300, stoppingToken).ConfigureAwait(false); // Human feedback window

 this.ClearLine();
 this.Write(SystemColor, "Executing...");

 await ProcessDataAsync(
 result.Schema,
 result.Query,
 reader =>
 {
 this.ClearLine();
 this.WriteData(reader);
 }).ConfigureAwait(false);
 }

 // Execute query and display the resulting data-set.
 async Task ProcessDataAsync(string schema, string query, Action<IDataReader> callback)
 {
 try
 {
 using var connection = await this._sqlProvider.ConnectAsync(schema).ConfigureAwait(false);
 using var command = connection.CreateCommand();

#pragma warning disable CA2100 // Review SQL queries for security vulnerabilities
 command.CommandText = query;
#pragma warning restore CA2100 // Review SQL queries for security vulnerabilities

 using var reader = await command.ExecuteReaderAsync(stoppingToken).ConfigureAwait(false);
 callback.Invoke(reader);
 }
#pragma warning disable CA1031 // Do not catch general exception types
 catch (Exception exception)
#pragma warning restore CA1031 // Do not catch general exception types
 {
 this.ClearLine();
 this.WriteLine(FocusColor, exception.Message);
 }
 }
}

代码结构非常清晰,主要包含数据读取、SQL命令执行、命令行输入处理和数据展示等功能。整个转换过程使用了异步编程模式,保证了良好的用户交互体验和程序性能。

用户交互设计

在用户交互方面,该程序展现了良好的设计。用户可以在控制台中输入自然语言描述的目标,程序会解析这一描述并生成对应的SQL查询。如果成功生成,还会提供是否执行查询的选项,在用户确认后,能够将查询结果以格式化的方式显示在控制台上。

数据展示和交互

在数据展示方面,开发人员精心设计了一整套显示系统,能够将查询结果分页显示,同时考虑到了窗口宽度和数据字段宽度的问题,确保了数据显示的友好性和阅读性。

private void WriteData(IDataReader reader)
{
 int maxPage = Console.WindowHeight - 10;

 var widths = GetWidths().ToArray();
 var isColumnTruncation = widths.Length < reader.FieldCount;
 var rowFormatter = string.Join('│', widths.Select((width, index) => width == -1 ? $"{{{index}}}" : $"{{{index},-{width}}}"));

 if (isColumnTruncation)
 {
 rowFormatter = string.Concat(rowFormatter, isColumnTruncation ? $"│{{{widths.Length}}}" : string.Empty);
 }

 WriteRow(GetColumns());

 WriteSeparator(widths);

 bool showData;

 do
 {
 int count = 0;
 while (reader.Read() && count < maxPage)
 {
 WriteRow(GetValues());

 count++;
 }

 if (count >= maxPage)
 {
 showData = this.Confirm($"...More?");
 this.ClearLine();
 if (!showData)
 {
 this.WriteLine();
 }
 }
 else
 {
 showData = false;
 this.WriteLine();
 }
 } while (showData);

 void WriteRow(IEnumerable<string> fields)
 {
 fields = TrimValues(fields).Concat(isColumnTruncation ? new[] { "..." } : Array.Empty<string>());

 this.WriteLine(SystemColor, rowFormatter, fields.ToArray());
 }

 IEnumerable<string> TrimValues(IEnumerable<string> fields)
 {
 int index = 0;
 int totalWidth = 0;

 foreach (var field in fields)
 {
 if (index >= widths.Length)
 {
 yield break;
 }

 var width = widths[index];
 ++index;

 if (width == -1)
 {
 var remainingWidth = Console.WindowWidth - totalWidth;

 yield return TrimValue(field, remainingWidth);
 yield break;
 }

 totalWidth += width + 1;

 yield return TrimValue(field, width);
 }
 }

 string TrimValue(string? value, int width)
 {
 value ??= string.Empty;

 if (value.Length <= width)
 {
 return value;
 }

 return string.Concat(value.AsSpan(0, width - 4), "...");
 }

 void WriteSeparator(int[] widths)
 {
 int totalWidth = 0;

 for (int index = 0; index < widths.Length; index++)
 {
 if (index > 0)
 {
 this.Write(SystemColor, "┼");
 }

 var width = widths[index];

 this.Write(SystemColor, new string('─', width == -1 ? Console.WindowWidth - totalWidth : width));

 totalWidth += width + 1;
 }

 if (isColumnTruncation)
 {
 this.Write(SystemColor, "┼───");
 }

 this.WriteLine();
 }

 IEnumerable<int> GetWidths()
 {
 if (reader.FieldCount == 1)
 {
 yield return -1;
 yield break;
 }

 int totalWidth = 0;

 for (int index = 0; index < reader.FieldCount; ++index)
 {
 if (index == reader.FieldCount - 1)
 {
 // Last field gets remaining width
 yield return -1;
 yield break;
 }

 var width = GetWidth(reader.GetFieldType(index));

 if (totalWidth + width > Console.WindowWidth - 11)
 {
 yield break;
 }

 totalWidth += width;

 yield return width;
 }
 }

 static int GetWidth(Type type)
 {
 if (!s_typeWidths.TryGetValue(type, out var width))
 {
 return 16; // Default width
 }

 return width;
 }

 IEnumerable<string> GetColumns()
 {
 for (int index = 0; index < reader.FieldCount; ++index)
 {
 var label = reader.GetName(index);

 yield return string.IsOrWhiteSpace(label) ? $"#{index + 1}" : label;
 }
 }

 IEnumerable<string> GetValues()
 {
 for (int index = 0; index < reader.FieldCount; ++index)
 {
 yield return reader.GetValue(index)?.ToString() ?? string.Empty;
 }
 }
}

整个程序对于输入的处理非常人性化,如果用户输入了无关的或格式不正确的指令,程序会给出相应的提示,引导用户重新输入。

结语

Nl2Sql项目不仅展示了现代AI技术的强大能力,也体现了.NET生态在人工智能应用中的活跃度,并且推动了开发者之间的技术互助和分享。Nl2Sql证明了在未来,我们可以期待更多的自然语言处理工具来帮助我们更好地与数据交互。

2

站心网

随着技术的发展,人工智能在各个领域的应用已经不再是新鲜事。在数据库查询领域能够自然地将人类语言转换为..

为您推荐

.NET 10 C# 14 必知的 6 大语法糖:提升开发效率,简洁优雅

.NET 10(搭配 C# 14)正式上线,带来一批令人惊喜的语法糖改进,让日常开发变得更加简洁、高效。无论你是编写企业级系统、构建性能敏感型组件,还是编写一次性脚本,这些新语法糖都能让你的代码更具可读性、减少..

2025年最佳.NET C#实现PDF转Word:主流库功能与对比

在日常工作中,将 PDF 文件高质量地转换为 Word 文档已成为许多企业和办公人员的常见需求,尤其是在文档归档、编辑流程自动化和办公系统集成等场景中尤为重要。对于使用 .NET 平台,特别是 C# 的开发者来说,选择一..

.NET Core 图像处理:Magick.NET 与 SkiaSharp 的全面对比

随着 .NET Core 的发展,传统的 System.Drawing 库因其对 Windows 的依赖性和在跨平台应用中的限制,逐渐被其他图像处理库所取代。在众多替代方案中,Magick.NET 和 SkiaSharp 是最受欢迎的两个选择。本文将从多个维..

使用.NET C#将图片转换为.ico图标文件的多种方法

在Windows应用程序开发中,图标(.ico)文件是不可或缺的一部分。本文将介绍如何使用.NET C#将常见的图片格式(如PNG、JPG、BMP)转换为.ico文件,并提供多种实现方式,包括使用System.Drawing、Magick.NET库的方法..

RevokeMsgPatcher:.NET开源、免费的Windows下PC版微信/QQ/TIM的防撤回补丁

今天给大家分享一款基于 .NET 开源、免费的适用于 Windows 下 PC 版微信/QQ/TIM的防撤回补丁(我已经看到了,撤回也没用了),通用的微信多开工具:RevokeMsgPatcher。RevokeMsgPatcher GitHub地址:https://github...

RabbitMQ 4.0+重大更新!.NET(C#)开发者必须掌握的6大升级要点

RabbitMQ 作为一款广受欢迎的消息队列中间件,近年来从 3.x 版本升级到 4.0+,带来了显著的功能增强和架构调整。与此同时,其官方 C# 客户端也从 6.x 版本跃升至 7.0,引入了全新的编程模型和性能优化。这些变化不仅..

Paylinks:基于现代 .NET 的跨平台第三方支付 SDK 详解与使用示例

Paylinks 是一套基于现代 .NET 开发的,支持跨平台、多商户的第三方支付SDK。该项目旨在简化开发者接入第三方支付平台的过程,特别是针对支付宝和微信支付,便于快速集成支付功能。Paylinks 提供了丰富的配置选项和..

.NET 使用 Qdrant.Client 连接向量数据库 Qdrant 的完整指南

随着向量数据库在 AI、搜索、推荐系统等领域的广泛应用,越来越多的开发者开始将 Qdrant 集成到自己的项目中。对于 .NET 开发者而言,使用 Qdrant.Client 实现与 Qdrant 的高效连接和数据操作,是构建语义搜索和嵌入..

Entity Framework(EF) Core 10新特性全面解析:提升开发效率的关键更新​

Entity Framework Core(EF Core)作为 .NET 平台的主流对象关系映射(ORM)框架,持续为开发者提供高效、灵活的数据访问解决方案。​在最新发布的 EF Core 10 中,微软引入了多项新特性,旨在简化数据库操作,提升..

.NET(C#)使用 iText7 高效处理PDF文件的全面指南​

在现代软件开发中,PDF 文件处理是一个常见且重要的需求。无论是生成报告、填充表单、添加水印,还是进行数字签名,选择一个功能强大的 PDF 库至关重要。iText7 作为一款开源且功能丰富的 PDF 操作库,广泛应用于 C#..

.NET Exception: Received an unexpected EOF or 0 bytes from the transport stream.解决方法

在 .NET 应用中试用HttpClient调用API异常报错“Received an unexpected EOF or 0 bytes from the transport stream,通常表示在进行 HTTPS 通信时,SSL/TLS 握手未能成功完成,导致连接被意外关闭。​以下是一..

微软退出中国对.NET开发人员有什么影响?

关于微软将停止在中国运营的报道,微软中国方面已明确表示该信息不实。网传邮件截图显示,“由于地缘政治及国际业务环境的变化,微软将调整其全球战略布局,并将于2025年4月8日起正式停止在中国区的运营”..

EasyCaching:一款灵活高效的 .NET 缓存库

EasyCaching 项目简介EasyCaching 是一个开源的 .NET 缓存抽象库,由 DotNetCore 团队开发,旨在为 .NET 应用提供简单、统一、强大且可扩展的缓存解决方案。它支持内存缓存(In-Memory)、Redis、Memcached、LiteDB..

.NET 依赖注入如何一个接口注册两种实现

在.NET的依赖注入(Dependency Injection,DI)系统中,一个接口注册两种或多种实现是常见的需求,尤其是在需要根据不同场景或条件选择不同实现时。以下是一些实现方法:1. 使用 IEnumerable<T> 解析所有实现这是最..

.NET C# 过滤从富文本编辑器html里的Javascript脚本

富文本编辑器在允许用户输入丰富内容的同时,也带来了跨站脚本攻击(XSS)的风险。过滤提交的 HTML 中的 <script> 脚本是防止跨站脚本攻击(XSS)的关键步骤。在 .NET C# 服务端过滤 <script> 脚本主要有以下几种方..

ZLinq:.NET 高性能 LINQ 替代方案及其使用指南

在 .NET 开发中,LINQ(Language Integrated Query)为数据查询提供了简洁且强大的语法。然而,传统的 LINQ 在处理大量数据时可能会引发性能瓶颈,主要由于频繁的内存分配和对象创建。为解决这一问题,Cysharp 团队..

.NET使用AutoMapper简化对象映射

在.NET软件开发中,常常需要将一个对象的数据转换并映射到另一个对象上。​这种手动映射的过程既繁琐又容易出错,影响开发效率和代码可维护性。​为了解决这一问题,AutoMapper应运而生。​什么是 AutoMapper?AutoM..

.NET C# RESTful API交互Refit库使用教程

Refit 是一个 .NET C# 库,它简化了与 RESTful API 的交互。Refit 受到 Square 的 Retrofit 库的启发,它将 REST API 转换为实时接口,允许你以声明方式定义 REST API 调用。Refit 的特点1. 声明式 API 定义:Refit ..

.NET C# System.Text.Json进阶使用技巧

System.Text.Json 是 .NET 中用于处理 JSON 数据的强大库。除了基本用法外,它还提供了许多进阶技巧,可以帮助你更高效、更灵活地处理 JSON 数据。以下是一些 System.Text.Json 的进阶使用技巧:1. 自定义序列化和反..

.NET Core 使用ML.NET 机器学习分析预测股票走势

在 .NET Core 中,你可以利用 ML.NET 框架来构建机器学习模型,以预测股票价格走势。以下是一个基本的实现步骤:​1. 准备数据:​收集并整理股票的历史数据,包括日期、开盘价、最高价、最低价、收盘价和成交量等信..

发表回复

返回顶部

微信分享

微信分享二维码

扫描二维码分享到微信或朋友圈

链接已复制