Como analisar JSON no Scala usando classes Scala padrão?

113

Estou usando a compilação na classe JSON no Scala 2.8 para analisar o código JSON. Não quero usar o Liftweb nem um nem outro para minimizar as dependências.

Do jeito que estou fazendo parece muito imperativo, existe uma maneira melhor de fazer isso?

import scala.util.parsing.json._
...
val json:Option[Any] = JSON.parseFull(jsonString)
val map:Map[String,Any] = json.get.asInstanceOf[Map[String, Any]]
val languages:List[Any] = map.get("languages").get.asInstanceOf[List[Any]]
languages.foreach( langMap => {
val language:Map[String,Any] = langMap.asInstanceOf[Map[String,Any]]
val name:String = language.get("name").get.asInstanceOf[String]
val isActive:Boolean = language.get("is_active").get.asInstanceOf[Boolean]
val completeness:Double = language.get("completeness").get.asInstanceOf[Double]
}
Phil
fonte

Respostas:

129

Esta é uma solução baseada em extratores que farão o cast da classe:

class CC[T] { def unapply(a:Any):Option[T] = Some(a.asInstanceOf[T]) }

object M extends CC[Map[String, Any]]
object L extends CC[List[Any]]
object S extends CC[String]
object D extends CC[Double]
object B extends CC[Boolean]

val jsonString =
    """
      {
        "languages": [{
            "name": "English",
            "is_active": true,
            "completeness": 2.5
        }, {
            "name": "Latin",
            "is_active": false,
            "completeness": 0.9
        }]
      }
    """.stripMargin

val result = for {
    Some(M(map)) <- List(JSON.parseFull(jsonString))
    L(languages) = map("languages")
    M(language) <- languages
    S(name) = language("name")
    B(active) = language("is_active")
    D(completeness) = language("completeness")
} yield {
    (name, active, completeness)
}

assert( result == List(("English",true,2.5), ("Latin",false,0.9)))

No início do loop for, envolvo artificialmente o resultado em uma lista de modo que produza uma lista no final. Então, no restante do loop for, uso o fato de que geradores (usando <-) e definições de valor (usando =) farão uso dos métodos de não aplicação.

(Resposta mais antiga editada - verifique o histórico de edição se estiver curioso)

Huynhjl
fonte
Desculpe por desenterrar um post antigo, mas qual é o significado do primeiro Some (M (mapa)) no loop? Eu entendo que o M (mapa) está extraindo o mapa para a variável "mapa", mas e o Some?
Federico Bonelli
1
@FedericoBonelli, JSON.parseFullretorna Option[Any], então começa com List(None)ou List(Some(any)). O Someé para a correspondência de padrões ativada Option.
Huynhjl
21

É assim que faço a correspondência de padrões:

val result = JSON.parseFull(jsonStr)
result match {
  // Matches if jsonStr is valid JSON and represents a Map of Strings to Any
  case Some(map: Map[String, Any]) => println(map)
  case None => println("Parsing failed")
  case other => println("Unknown data structure: " + other)
}
Matthias Braun
fonte
você pode dar um exemplo de seu jsonStr, ele não está funcionando com o exemplo acima de jsonStr
priya khokher
Pode valer a pena postar uma pergunta sobre o seu problema. No momento, não tenho o Scala instalado em minha máquina, então não tenho uma string JSON pronta.
Matthias Braun
12

Eu gosto da resposta de @huynhjl, ela me levou pelo caminho certo. No entanto, não é excelente para lidar com condições de erro. Se o nó desejado não existir, você obterá uma exceção de elenco. Eu adaptei isso um pouco para fazer uso Optionpara lidar melhor com isso.

class CC[T] {
  def unapply(a:Option[Any]):Option[T] = if (a.isEmpty) {
    None
  } else {
    Some(a.get.asInstanceOf[T])
  }
}

object M extends CC[Map[String, Any]]
object L extends CC[List[Any]]
object S extends CC[String]
object D extends CC[Double]
object B extends CC[Boolean]

for {
  M(map) <- List(JSON.parseFull(jsonString))
  L(languages) = map.get("languages")
  language <- languages
  M(lang) = Some(language)
  S(name) = lang.get("name")
  B(active) = lang.get("is_active")
  D(completeness) = lang.get("completeness")
} yield {
  (name, active, completeness)
}

Claro, isso não trata os erros, mas sim os evita. Isso resultará em uma lista vazia se algum dos nós json estiver faltando. Você pode usar um matchpara verificar a presença de um nó antes de agir ...

for {
  M(map) <- Some(JSON.parseFull(jsonString))
} yield {
  map.get("languages") match {
    case L(languages) => {
      for {
        language <- languages
        M(lang) = Some(language)
        S(name) = lang.get("name")
        B(active) = lang.get("is_active")
        D(completeness) = lang.get("completeness")
      } yield {
        (name, active, completeness)
      }        
    }
    case None => "bad json"
  }
}
Murrayju
fonte
3
Acho que cancelar a aplicação de CC pode ser significativamente simplificado para def unapply(a: Option[Any]): Option[T] = a.map(_.asInstanceOf[T]).
Suma,
Scala 2.12 parece precisar de ';' antes das linhas com '=' na compreensão de for.
akauppi
Para mim, o código superior não "produziu uma lista vazia se algum dos nós json estiver faltando", mas forneceu um MatchError(Scala 2.12). É necessário envolver o for em um bloco try / catch para isso. Alguma ideia melhor?
akauppi
7

Tentei algumas coisas, favorecendo a correspondência de padrões como uma forma de evitar a projeção, mas tive problemas com o apagamento de tipos nos tipos de coleção.

O principal problema parece ser que o tipo completo do resultado da análise espelha a estrutura dos dados JSON e é complicado ou impossível de definir totalmente. Acho que é por isso que Any é usado para truncar as definições de tipo. O uso de Any leva à necessidade de fundição.

Hackeei algo abaixo que é conciso, mas extremamente específico para os dados JSON implícitos no código em questão. Algo mais geral seria mais satisfatório, mas não tenho certeza se seria muito elegante.

implicit def any2string(a: Any)  = a.toString
implicit def any2boolean(a: Any) = a.asInstanceOf[Boolean]
implicit def any2double(a: Any)  = a.asInstanceOf[Double]

case class Language(name: String, isActive: Boolean, completeness: Double)

val languages = JSON.parseFull(jstr) match {
  case Some(x) => {
    val m = x.asInstanceOf[Map[String, List[Map[String, Any]]]]

    m("languages") map {l => Language(l("name"), l("isActive"), l("completeness"))}
  }
  case None => Nil
}

languages foreach {println}
Don Mackenzie
fonte
Eu gosto que o usuário do implícito o extraia.
Phil
4
val jsonString =
  """
    |{
    | "languages": [{
    |     "name": "English",
    |     "is_active": true,
    |     "completeness": 2.5
    | }, {
    |     "name": "Latin",
    |     "is_active": false,
    |     "completeness": 0.9
    | }]
    |}
  """.stripMargin

val result = JSON.parseFull(jsonString).map {
  case json: Map[String, List[Map[String, Any]]] =>
    json("languages").map(l => (l("name"), l("is_active"), l("completeness")))
}.get

println(result)

assert( result == List(("English", true, 2.5), ("Latin", false, 0.9)) )
Yuriy Tumakha
fonte
3
Isso está obsoleto no último scala, Unbundled. Alguma ideia de como usá-lo então?
Sanket_patil
4

Você pode fazer assim! Muito fácil de analisar o código JSON: P

package org.sqkb.service.common.bean

import java.text.SimpleDateFormat

import org.json4s
import org.json4s.JValue
import org.json4s.jackson.JsonMethods._
//import org.sqkb.service.common.kit.{IsvCode}

import scala.util.Try

/**
  *
  */
case class Order(log: String) {

  implicit lazy val formats = org.json4s.DefaultFormats

  lazy val json: json4s.JValue = parse(log)

  lazy val create_time: String = (json \ "create_time").extractOrElse("1970-01-01 00:00:00")
  lazy val site_id: String = (json \ "site_id").extractOrElse("")
  lazy val alipay_total_price: Double = (json \ "alipay_total_price").extractOpt[String].filter(_.nonEmpty).getOrElse("0").toDouble
  lazy val gmv: Double = alipay_total_price
  lazy val pub_share_pre_fee: Double = (json \ "pub_share_pre_fee").extractOpt[String].filter(_.nonEmpty).getOrElse("0").toDouble
  lazy val profit: Double = pub_share_pre_fee

  lazy val trade_id: String = (json \ "trade_id").extractOrElse("")
  lazy val unid: Long = Try((json \ "unid").extractOpt[String].filter(_.nonEmpty).get.toLong).getOrElse(0L)
  lazy val cate_id1: Int = (json \ "cate_id").extractOrElse(0)
  lazy val cate_id2: Int = (json \ "subcate_id").extractOrElse(0)
  lazy val cate_id3: Int = (json \ "cate_id3").extractOrElse(0)
  lazy val cate_id4: Int = (json \ "cate_id4").extractOrElse(0)
  lazy val coupon_id: Long = (json \ "coupon_id").extractOrElse(0)

  lazy val platform: Option[String] = Order.siteMap.get(site_id)


  def time_fmt(fmt: String = "yyyy-MM-dd HH:mm:ss"): String = {
    val dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss")
    val date = dateFormat.parse(this.create_time)
    new SimpleDateFormat(fmt).format(date)
  }

}
Echo Zeng
fonte
2

Esta é a maneira como eu faço a biblioteca combinadora do Scala Parser:

import scala.util.parsing.combinator._
class ImprovedJsonParser extends JavaTokenParsers {

  def obj: Parser[Map[String, Any]] =
    "{" ~> repsep(member, ",") <~ "}" ^^ (Map() ++ _)

  def array: Parser[List[Any]] =
    "[" ~> repsep(value, ",") <~ "]"

  def member: Parser[(String, Any)] =
    stringLiteral ~ ":" ~ value ^^ { case name ~ ":" ~ value => (name, value) }

  def value: Parser[Any] = (
    obj
      | array
      | stringLiteral
      | floatingPointNumber ^^ (_.toDouble)
      |"true"
      |"false"
    )

}
object ImprovedJsonParserTest extends ImprovedJsonParser {
  def main(args: Array[String]) {
    val jsonString =
    """
      {
        "languages": [{
            "name": "English",
            "is_active": true,
            "completeness": 2.5
        }, {
            "name": "Latin",
            "is_active": false,
            "completeness": 0.9
        }]
      }
    """.stripMargin


    val result = parseAll(value, jsonString)
    println(result)

  }
}
hmehdi
fonte