Category Archives: Uncategorized

GigaScience´s Impact Factor

Even though the editors of GigaScience don’t like Impact Factors (and I agree with them), GigaScience has received a very high Impact Factor, 7.46. I’m quite happy since we published a paper in GigaScience last year, Enhanced reproducibility of SADI web service workflows with Galaxy and Docker.

Tagged , , , , , , , , , , ,

Charla TikiTalka sobre Linked Data

El viernes 12 Febrero di una charla sobre Datos enlazados y Web Semántica (Slides.com), como parte del evento TikiTalka organizado por VE Interactive Bilbao. Las otras charlas fueron muy interesantes y había cerveza gratis y futbolín, ¿Qué más se puede pedir?

Crítica a Linked Data en Open Data Euskadi (III) Actualización

Desde la primera crítica constructiva que hice sobre la versión “Linked Data” de Open Data Euskadi algunas URIs han cambiado, pero los problemas descritos persisten (En el Open Data Day 2014 propusimos una solución). Añado aquí las URIs nuevas:

  1. Web de datasets: http://opendata.euskadi.eus/w79-contdata/es/contenidos/ds_localizaciones/consulados/es_euskadi/index.shtml
  2. En el dataset en turtle, URI del consulado de Suiza: http://www2.irekia.euskadi.eus/es/entities/1047
  3. Negociación contenido simulando ser navegador web: curl http://www2.irekia.euskadi.eus/es/entities/1047. Resultado: HTML (OK)
  4. Negociación contenido simulando ser agente automático que quiere RDF/XML: curl –header “Accept: application/rdf+xml” http://www2.irekia.euskadi.eus/es/entities/1047. Resultado: HTML (not OK).

El problema es que la URI principal solo lleva a la página web, y dentro de la página web, hay una URL con un archivo RDF (http://www2.irekia.euskadi.eus/es/entities/1047-consulado-suiza.rdf). Eso viola el principio básico (Linked Data e incluso REST en general) de que las URIs denotan entidades, no sus representaciones. Tampoco hay enlaces (predicados) a, por ejemplo, Suiza en DBPedia.

Probamos con otro dataset, esta vez sacado de la bola Open Data Euskadi de la nube Linked Open Data. El primer dataset de la lista es Farmacias de euskadi: http://opendata.euskadi.eus/contenidos/ds_localizaciones/farmacias_de_euskadi/opendata/r01DataSet.rdf. Pero el dataset no es sobre farmacias, es sobre metadatos de datos de farmacias, y el único enlace que parece significativo (es decir, tendría datos reales de farmacias) es http://opendata.euskadi.eus/contenidos/ds_localizaciones/farmacias_de_euskadi/farmacia/farmacias y no funciona (ni para humanos ni para agentes). El resto son triples sobre Dublin Core etc., más que predicados a otros datos. El resto de lo datasets siguen el mismo patrón: más que datos son metadatos, y los enlaces no funcionan.

Docker image for SADI-Galaxy

About

SADI is a framework to define Semantic Web Services that consume and output RDF, and SADI-Galaxy makes SADI services available in the popular Galaxy platform. Thus, SADI-Galaxy is a nice SADI client to invoke SADI services in an environment that Biologists use often.

On the other hand, Docker is a sort of “virtualisation” environment for deploying applications very easily, without configuration. Therefore I have created a Docker image for deploying a Galaxy instance already containing SADI-Galaxy, so anyone interested in SADI-Galaxy can try it out easily within having to configure Galaxy and SADI-Galaxy.

Deploying the container

Install Docker and do the thingy for avoiding sudo access:

$ sudo apt-get install docker.io
$ sudo groupadd docker
$ sudo gpasswd -a your_user docker
$ sudo service docker.io restart

(You might need to log out and back in).

Pull the SADI-Galaxy Docker image:

$ docker pull mikeleganaaranguren/sadi-galaxy

Check that it has been succesfully pulled:

$  docker images

REPOSITORY                        TAG                 IMAGE ID            CREATED             VIRTUAL SIZE
mikeleganaaranguren/sadi-galaxy   latest              xxxxxxxxxxx        3 days ago          895.8 MB

Run the container (Make sure that the port 8080 is listening and free in the host machine, or use a different one and map it to the container, e.g. 8389:8080):

$ docker run -d -p 8080:8080 mikeleganaaranguren/sadi-galaxy

If you go with your web browser to http://127.0.0.1:8080 (or the IP of the host machine) there should be a Galaxy server runing. The SADI tools are under SADI services, on the left pane.

Galaxy main

Login (in the User menu on the top; user:user@user.com, password:useruser) and a history should appear on the right pane.

Galaxy history

In the Workflow menu, there is only one workflow, OpenLifeData2SADI SADI. You can have a look by clicking on the workflow name and then clicking edit:

Galaxy workflow

Run the workflow.

Galaxy workflow

Use dataset 1 from the history as input for the workflow (UniProt_IDs.txt).

Galaxy run workflow

When the worfklow has finished new steps will appear in the history (20-37).

Galaxy workflow done

You can use the workflow, by inspecting the steps, to become familiar with SADI-Galaxy.