关于法律人工智能数据和算法问题的若干思考

来源 :计算机科学 | 被引量 : 0次 | 上传用户:donny0325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能技术的不断发展使其在司法方面的应用逐渐增多,并引起广泛关注.具体来说,人工智能已经在合同审查、智慧法院等应用场景中崭露头角,相比传统人工,人工智能的高效率表现展示了其在司法领域的巨大应用潜力.但在其他应用场景,如智能司法裁判,虽然国内外有一定尝试,并取得了一些成果,但仍面临着数据样本量不足、算法与待解决实际问题匹配度不够的问题,以及算法过程不够透明等方面的质疑.文中围绕现有法律人工智能的相关工作,探索了人工智能可能带来的司法流程上的巨大变革,并对人工智能目前在智能裁判中遇到的数据和算法方面的问题是否会对司法的公正性产生影响进行了探讨,最后对上述问题的解决方案以及司法人工智能的未来发展路线略抒拙见,以期人工智能技术在我国司法领域有更为系统性的应用,助力社会主义法治建设.
其他文献
在众包平台上,不同类型的用户在参与意愿、工作动机、业务能力等方面具有多样性和差异性的特征,在平台上产生的价值也不同.基于用户价值度量对用户进行细分,是更好地洞察用户价值和需求、对用户进行个性化和精细化管理的关键.同时,选择众包用户价值衡量维度也是目前需要解决的问题.因此,该研究首先基于RFM模型并结合众包平台及众包用户的特性,将用户信用纳入用户价值模型,提出并构建了众包用户价值衡量模型RFMC(Recency,Frequency,Monetary,Credit);然后,结合“一品威客”平台获取所需的实验数
现在由于互联网的广泛应用和迅猛发展,Web应用的使用越来越广泛,面临的问题就是攻击者可以使用SQL注入漏洞获取到服务器的库名、表名、字段名,进而来盗取数据库中用户名和密码等数据.攻击者通过非法手段来获取数据库的权限,可以对Web应用程序进行删改等操作.SQL注入漏洞使Web应用程序安全存在巨大的安全隐患,对整个数据库也有严重的影响.
为了提高集群网络中全序数据传输性能,本文提出了一种新颖的传输框架——TOC,该框架由TOC-RE策略和TOC-Re策略两部分组成.首先,提出了层次化时间戳聚合机制,使TOC-RE策略能够提供尽力而为的服务;其次,设计了丢包处理机制和故障恢复机制,使TOC-Re策略实现可靠的传输服务.采用测试平台评估TOC的性能,结果表明TOC以较低的开销实现了高吞吐量和低延迟,具有一定的可扩展性.
学术文献中蕴含着丰富的引用信息,文献引用是科研评价和文献计量领域的主要分析对象和研究热点.相比基于数学和统计学的定量分析方法,利用可视化方法既可以实现引用信息时序、层次结构的直观呈现,也可以实现复杂引用网络的交互式挖掘,对科研评价改革和文献计量方法创新具有重要意义.文中首先介绍了近年来国内外学术引用信息分析的相关研究,总结了学术引用信息可视化的一般框架;然后根据实体评价和文献计量两类应用场景对可视化方法进行分类,详细阐述了可视化方法在两类应用场景中的研究现状和优缺点;最后指出了学术引用信息可视化面临的挑战
图嵌入降维算法由于其有效性被广泛应用.传统图嵌入算法构造K-Nearest Neighbors(K-NN)图的计算复杂度至少为O(n2 d),其中n为样本数,d为样本维度.在数据量大的情况下,构造K-NN图将非常耗时,因为其计算复杂度与样本数的平方成正比,这将限制图嵌入算法在大规模数据集上的应用.为降低构图过程的计算复杂度,提出一种基于锚点的快速无监督图嵌入算法(Fast Unsupervised Graph Embedding Based on Anchors,FUGE).该算法首先从数据集中选取锚点(
社交网络的影响力最大化是网络分析领域的关键问题,在广告宣传、舆情控制等场景有着诸多应用.该问题指在一个社交图中选取一组源节点,使得所选取的节点集合能够在某种传播模型中形成最大的影响力.由于节点选取问题是典型的NP-hard问题,在大型网络中会遭遇组合爆炸.近些年来,国内外学者一般采用启发式算法求得问题的近似解.然而,现有工作鲜有考虑到节点选取的成本,所得到的解无法满足实际应用中的预算条件.针对此问题,首先考虑节点选取的成本约束,并对成本受限条件下的社交网络影响最大化问题进行数学建模;其次为节约源节点的冗余
发电机惯量是电力系统频率特性分析与其在线应用中的重要参数.基于发电机正常运行时机端有功功率和频率的类噪声信号可对发电机惯量进行实时辨识.然而实测数据质量存在缺陷,导致现有算法对实测数据的辨识效果较差.为解决该问题,文中以谱分析与系统辨识理论为基础,建立惯量辨识结果的先验方差统计量.通过参考系统估计、模型参数方差估计和惯量方差估计3个步骤,计算得到先验方差.并在进行辨识前对类噪声数据段进行评价和筛选,提升惯量辨识的准确度.基于仿真数据和实测数据的数据评估筛选结果验证了该方法的有效性.结果表明,先验方差较小的
国际跳棋的博弈系统中,UCT算法是一个比较新颖的算法,其效果得到了广泛认可.但是UCT算法的缺点也同样明显,终局下的处理明显不如稳定性更强的Alpha-Beta算法.为避免UCT算法的不稳定性,本文采取限制搜索深度和增加扩展条件的方法对UCT算法进行改进,改进后的UCT算法胜率远超过改进前的UCT算法胜率,使得博弈水平得到了极大的提升.
复杂社会系统建模是社会计算面临的首要问题.面向社会计算领域的建模流程与需求,提出了一种模型深度集成架构,称为POV框架.该框架由物理层、覆盖层和虚拟层3部分组成,提供了模型的组织、表达和集成方法.基于该方法搭建了面向社会计算数据模型交互共享集成平台,为研究者们提供包括数据资源、分析工具和建模仿真计算环境的社会计算实验平台.应用示例证明了该平台能够为研究者进行社会计算研究提供有效支撑.
属性约简是三支决策理论的重要研究内容之一.然而,现有基于三支决策的属性约简方法过于严格,限制了其属性约简的效率.文中提出了一种基于正域的三支近似属性约简方法.具体地,属性约简被视为根据条件属性与决策属性的相关性,将所有属性划分为正域、负域或边界域3类的过程.首先通过保留正域度量来去除负域属性,然后通过放松正域度量来迭代地排除一些边界属性,最后将剩余属性构成一个近似约简.UCI数据实验结果显示,与其他代表性的方法相比,所提方法能在保持甚至提升性能的同时获得更小的属性约简,说明了所提方法的有效性.